気合でなんとか

@ningensei848が頑張った記録

2017秋学期 月曜 コンピュータシステムとネットワーク 3週目

10/15に基本情報技術者試験があった。

で、その前日に腸閉塞をやらかしていたので、体調は最悪だった。

土浦会場とかいうから馬鹿正直に土浦駅までバスで行ってしまったのだが、会場はなんと学院大であった。クッソ早起きした意味もなかった……

というわけで、今日やるはずだったことをまとめる。

目次

 

  1. 情報の表現
  2. n進数
  3. 数値データの扱い
  4. 文字データの扱い
  5. 音声データの扱い
  6. 画像データの扱い

 

 

情報の表現

どんな情報でも、0と1、onとoff、あるかないかの二つの状態であらわされる。この性質を用いて、2進数から8進数・16進数、10進数に変換して情報を取り扱っている。

n進数

人類が日常的に使っているのは10進数である。位取り記法を用いる際に、一つの位に0-9までの十種類の数字を用いることができる。

n進法になっても同様に、位一つあたりにn種類の数字を用いることができる。

二進数では0と1、八進数では0-7、十六進数では0-Fまでを数字として用いることになる。

数値データの扱い

数値データには

整数/実数の区別があり、さらに整数には正負がある。

固定小数点形式

浮動小数点形式

 

文字データの扱い

0と1の組み合わせをあらかじめ示したコード表を作り、それに当てはめて文字列を作る。ASCIIコードやJISコードがあるが、近年ではUTF-8に統合されつつあるようだ。

音声データの扱い

標本化

量子化

アナログ信号とデジタル信号

画像データの扱い

画素、ドット、ピクセル、解像度、圧縮、静止画像と動画、RGB、CMYKBMP形式 JPG形式、GIF形式

2017秋学期 金曜 質的調査法 2週目

【重要な連絡】参考文献を選定せよ!

質的調査に用いた文献を各自一冊よむ(論文は不可)
各自で選び、10/22までに選びmanabaに登録
エスノグラフィ」で検索
→okならばAが返信、そうでなければ連絡返信

復習事項

ラポール…「橋を架ける」の意。親密な関係,相互信頼つまり信頼関係のこと。線ではなくグラデーションのイメージ。関係がよくなるほど(近くなるほど)濃くなる印象。

エスノグラフィー…民族誌,民族誌学 構造化/半構造化インタビュー, 参与観察, ケーススタディ, インフォーマント

 

今週の予定

1) オリエンテーション・質的調査とは何か

>> 2) 研究計画を立てる

3) 質問紙・同意書を作成する
4) インタビュー調査をおこなう
5) データを分析する
6) 成果をまとめる・研究における課題を克服する
7) 質的調査の理論的背景 1
8) 質的調査の理論的背景 2
9) 質的調査の理論的背景 3
10) まとめ

調査の進め方

  1. 研究計画の立案(目的、対象、期間、内容など) → 今回やるよ!!
  2. 質問紙と同意書の作成
  3. 調査実施
  4. 結果の集計分析
  5. 結果の発表

 

windows10にubuntuを入れてみる

発端

こういうツイートを見た

 

そもそも情弱なのでなにが神なのかわからん……(けもふれジャガー並感)

windowsというOS上でubuntuという異なるOSが気軽に動かせるのがすげー!ってことなんだろうが、いまいち恩恵がない(普段使いはすべてwin10なので当然なのだが)

 

ということでまずubuntuの導入、そしてubuntuとはなんぞやを見ていこうと思う。

 

導入

上記にもある通り、ストアに行ってインスコするだけである。あとはコントロールパネルからWindows Subsystem for Linuxを探してチェックボックスにレ点を入れるだけ。

猿でもできるな!

 

前提条件
  • windows10 creators updateを済ませていること

大変面倒(ではないが)だが更新しておくことが必要

下のストアからubuntuをインストールする過程でOSアップデートのページに飛ばされるだろうからとりあえずリンクに飛ぼう↓

 

www.microsoft.com

インストール出来たらコントロールパネルから[プログラムと機能]、ウィンドウ左側にあるはずの[windowsの機能の有効化または無効化]を選択して、新たに開いたウィンドウから「windows subsystem for Linux」を探してチェックボックスにレ点を入れて有効にしよう。これにて、windowsでのlinux環境の導入が終了したことになる。

(僕の場合は特に問題なく進んだけれど、何か不具合起きている場合もあるかもしれません…保証しかねます)

 

起動

[スタート]からUbuntuを探して起動するとコマンドプロンプトと同様の黒いウィンドウが開き、初めてならコマンドライン上で名前を求められる

(後で変えられるはずだが、面倒なので一度設定したら変えられないくらいの気持ちでユーザ名を設定する、その際、パスワードの設定も求められる)

 

これで、コマンドラインからUbuntuが実行できる環境が整った(はずだ…)

 

なにができるの?

Ubuntuとはそもそもなんじゃい

という疑問があった。とりあえずwikiに頼ってみる……。

Ubuntu - Wikipedia によれば、Ubuntuとは、“Debian GNU/Linuxをベースとしたオペレーティングシステム (OS) である。Linuxディストリビューションの1つであり、自由なソフトウェアとして提供されている”とは書いてあるがいったい何に使うんじゃい!というのがぼくらポンコツパソコンユーザである。youtubeが見れればPCなんてOSを名に使っていようが関係ないという言説は絶えない…ので下記リンクを見てみた。

eng-entrance.com

以下の14の用途が挙げられている。

  1. 普段使いの閲覧用PC
  2. サーバ
  3. 開発環境
  4. DTP環境
  5. DTM環境
  6. 動画編集環境
  7. CAD環境
  8. 3Dモデリング環境
  9. 組込みシステム
  10. スパコン
  11. ルータ
  12. ゲーム端末
  13. 学習用OS
  14. 緊急時メンテ用OS

特にサーバ構築というのはよく聞く。OSのインストールが無料で出来るというのは強すぎる強みだと思う。だからこうしてwindowsに簡単にインストールできたわけだが。

 

とりあえずの、おわり

今回のUbuntu導入でなにか生活が変わるだろうか?

まだまだ分からないことばかりだが、積極的にwindows以外のOSにも触っていくべきと思う。

 

2017秋学期 金曜 自然言語解析基礎 3週目

資料配布

http://cu.slis.tsukuba.ac.jp/class/nla2017/
u:nla2017,p:図書館情報メディア研究科2017
授業の「翌日に」内容をまとめたスライドを配布
授業はメモを取り、あとで復習すること

 

復習・キーワード

ラティス構造, 形態素, 階層構造, 連接可能性, 隠れマルコフモデル HMM.

隠れマルコフモデル(HMM)

隠れマルコフモデル - Wikipedia とは、確率モデルのひとつであり、観測されない(隠れた)状態をもつマルコフ過程である。

本日のお品書き

  1. 単語予測(N-gram)
  2. 言語モデル
  3. パープレキシティ・スムージング
  4. ニューラル言語モデル

単語の予測人間は、常識や構文の知識などにより文章を途中から先読みできる。→計算機はN-gramにより定式化N-gramとは……長さnのトークン列(単語列)n-1個の単語(形態素)の連続から、その次の単語の出てくる出現率(条件付確率)を求める。[次の単語の出現しやすさを確率であらわす]言語モデルの一つがN-gram

パープレキシティ

言語モデルの評価のためには訓練用コーパスとテストコーパスを別に用意し用いる。

その評価指標として、テストコーパス中の各文について次の単語の生起確率の逆数(=分岐数)を計算した結果から得られる単語予測分岐数の平均値→パープレキシティ

 低ければ低いほど良いモデルであるといえる

スムージング

問題:コーパスに一度も登場しない単語にどう対応するか?

(ゼロ頻度問題)

解決策:訓練用の文書集合中に一度も出現しなかった単語の組み合わせ(N-gram)について、ゼロでない数値を割り当てる(ほんの僅かに出現する可能性があるよ、ってことを残しておきたい)

いろいろあるけど……?

言語モデル入門より

  • 加算型スムージング
  • 補完型スムージング → 授業では、このタイプのうちGood-Turing推定を用いる!
  • バックオフ型スムージング

ニューラル言語モデル

NNを用いたモデル;確率モデルとして優れている

分散表現…重み行列xOne-hotベクトル =>単語の分散表現が使える!

 

2017秋学期 木曜 量的調査法 2週目

社会調査について:概要

社会調査法には2つある
・内部関与法
・外部観察法

社会調査をデータの取り方から分類すると
・統計的データから「量的調査」
・事例的データから「質的調査」

社会調査の原則
1.社会的である
2.科学である(再現性がある普遍的な結論)
3.データの収集と分析の両側面を総合的に行う

社会調査の目的別分類
1.官庁統計(公的な調査)
2.市場調査(私的な量的調査)
3.世論調査(私的な質的調査)
4.学術調査(上記以外)

調査を実施する前に定めることがら
・目的(テーマ・仮説)
・予算
・調査対象とその規模
・調査期間
・調査方法
・分析方法

記述と調査事象の概念化

事象の概念化:性別役割分業という事象から家事分担という生活場面におけるそのあり方(という概念)を問題にしよう

概念の操作的定義:何について質問するか,どのように質問するかについて定義を与える→「男性は外で働き、女性は内を守り助ける」という命題について賛否を論ずる

「説明」の論理構造
理論・説明
→現在の状況を合理化して形成
仮説

作業仮説

因果と相関の違い
無論、いくら相関があったところで、それは因果関係があるとは言えない
※相関関係は因果関係の前提条件に過ぎない

 

調査項目の分類

・説明項目と記述項目
・基礎項目:記述の詳細、説明の探索、要因のコントロール

調査票の設計

・質問や回答の選択肢がなるたけ単純であること
・表の中で、各質問項目が的確に位置付けられていること
・設問の理解に差が生じないこと(認識齟齬を減らす工夫)

調査項目の決定

・作業仮説における変数間の関係を調査項目として具体化する
 (項目が1つ1つの質問に対応)

要因から原因を探る

変数とは?
→つまりは要因のこと

調査項目の体系化とデザイン
→内容がどのように並んでいればいいか
論理性のflow
・漏斗型
・逆漏斗型

調査項目以外の質問とあいさつの意義

意義を説得的に説明し、回答者の意欲喚起
調査主体を明らかにする(責任の所在を明確に)
回答者の選出方法を説明
調査結果の利用方法を明示(倫理的配慮)
→匿名性を保つ、個人情報保護
フェイスシート(属性表?)
個人の基本属性に関する質問事項群
かつては調査票の表紙部分に置いたため「face」
※謝礼を出す場合、調査項目に応えずフェイスシートだけ埋められてしまうパターンがある。留意せねばならない。

自由記述に関して

のちの改善のためにアドバイスをもらう
スクリーニング質問
調査の該当者であるかどうかを確認(コンタミ防止)

質問文が答えるべき性質
妥当性…「概念」の様態を知るために的確な回答が得られるか
信頼性…常に同一の回答が得られるか
比較可能性…ほかの調査と比較できるか

 

 

実際に調査を始めるのは第四回から
surveymonkeyをつかう(は?)

2017秋学期 金曜 自然言語解析基礎 2週目

資料配布

http://cu.slis.tsukuba.ac.jp/class/nla2017/
u:nla2017,p:図書館情報メディア研究科2017
授業の「翌日に」内容をまとめたスライドを配布
授業はメモを取り、あとで復習すること

 

レポートを書いた

1.自然言語処理ツールのうちの1つを触った感想を送る

 

 “MeCabを「Windows10;Python3.5(64bit)」に入れる”

( https://qiita.com/o__mura/items/31fb75df6183199e95b6 ) を参考にして自分のPCにも入れてみようと思ったが、環境構築で敗走した。

"C:\Program Files (x86)\Microsoft Visual Studio 14.0\VC に移動"すればいいらしいのだが、残念ながらVS2017をインストールしただけではできなかった。(コンパイルの概念がklisにとって理解が難しいというのもあったかもしれない…)どうやらコマンドラインから、"vcvarsall.bat を実行して 64 ビット ツールセットを使用"すればいいらしいのだが、私の場合は「C:\Program Files (x86)」以下に\Microsoft Visual Studio しかなく(ver.情報がなかった)、今日は諦めてまた今度の機会に改めることにした。次の授業までには設定を終えたいところだ。

 配布元( http://taku910.github.io/mecab/#download )の説明を見る限り、形態素解析の雰囲気はなんとなくわかったように思える。とりあえず網羅的に分割していって、品詞を順に並べておかしくなければ正解とする…のような(意味が通ったらそれがエエやろ!という)

 

2.言語処理学会のページにアクセスし、NLPの研究動向をまとめる

 "音韻論, 形態論, …計算辞書学, ターミノロジー,…言語処理アルゴリズム,…機械翻訳, 情報検索…etc" というような分野に絞って学会活動を行うことはわかったが、近年の研究動向までは、HPだけではわからなかった。

 「自然言語処理 研究動向」でgoogle検索して出てきた結果を見た。殆どが人工知能や深層学習といった言葉が躍っている。少し考えればわかることであるが、膨大なデータを扱うためにコンピュータに計算をさせようというのは当然のことであり、近年著しい成長を遂げている機械学習・深層学習分野での応用をNLPに持ち込まないわけがないのであった。よって、近年の自然言語処理の研究動向としては、深層学習を用いたモデルが主流になっているようだ。

自然言語処理の重要性は何だろうかと考えた。それは、今後も膨大にあふれてくるデータを処理し加工し利用するための基礎の基礎の技術を支えることである。ディープラーニングと画像処理の発展により、物体認識で画像の名称・説明記述が出来るようになったり、AIが小説を生成するようになったり、waveNETはほぼ人が実際に話しているのと変わりないレベルでの音声生成を可能にした。現時点でもすごい業績が発表され続けているが、これはまだ序章に過ぎない。次なる分野は、AIとの共生というかコミュニケーションをもとにした字生活の改善である。人と人でしかなしえなかったコミュニケーション(≒対話)が、人と人工知能によって行われ、それがまたコミュニケーションを円滑にしていくためのデータとなる。俗にいう、強いAIも、自然言語処理の分野が発展し成熟していくとともに実現に近づけると思う。当然のことながら、逆説的に自然言語処理の分野が未発達ならば、そこにあるはずのデータをみすみす取り逃し、発展の機会も得られないということになる。いつの日か、デジタルネイチャーではないけれど、人と機械(≒人工知能,士郎正宗に言わせれば、“ghost”だが)が渾然一体となるときが来るのだろうが、来るその時のために、NLPの技術は必要不可欠であると考える。

 

形態素morpheme…意味を持つ言語の最小単位

自然言語の階層構造

・音素phoneme
形態素
・単語word
・文sentence
・文章/テキストtext

形態素解析

意味を持つ最小の言語単位を判別する
形態素の定義・難易度は言語に依存
英語の場合
・語基と接辞に分類→形態素の数、性、時制、人称、格などの決定
・各単語の品詞を分別(ここが難しい、多義語の判別)

日本語の形態素解析

・単語を区切る空白が存在しない
形態素の分割と同時に品詞を割り振る必要がある

日本語の場合の古典的方法…初期のJumanなど
・単語辞書と二単語間の「連接可能性辞書」を準備する
形態素解析をやるにあたって、辞書を作るというのは大切なこと)

 

 

ラティス構造を作りながら正解に迫っていく?

2017秋学期 月曜 経営の科学III 2週目

一週目は別の総合科目に行っていた(抽選で落ちた)

仕方がないので再募集がかかったこの科目に退避した

 

授業概要

生産管理(生産管理基礎,環境問題と現代生産美学)・人間・社会とIT(今後の要所であるITの進化に起因する企業経営や人間・社会のあり様の変貌と未来の展望)を説き,重要な問題点を認識し,社会の豊かさの考察を深める。

担当: 有馬澄佳 システム情報系
場所:3A403(後ろに座るほど出席点が下がる)

目的

商品サービスが企画・開発されてから消費者の手に渡るまでの一連の生産流通プロセスについて、事例のビジネスプロセスフロー分析から、最新の地域社会の活性化問題までを学ぶ。企業内活動に関しては、特に生産・品質管理および企業情報システムを中心に取り上げる。

目標

社会構造や産業構造の激変の時代、経済的変化・個人の価値観の変遷を受け止め。企業のおかれている社会環境や最新事例を知り、ビジネス・プロセスおよび生産流通のあり方について、基礎理論と事例をふまえて理解する。そして、今後の重要な社会的課題を理解し当事者として危機感を共有し、思考すること。

キーワード

ビジネスプロセスQFDVADFM生産管理生産スケジューリング品質管理社会・環境配慮サプライ・チェーン

第1回 【10月2日】

商品サービスが生産者から消費者の手に渡るまでのビジネスプロセスと課題を紹介し、今後の講義の展開を説明する

第2回 【10月10日】※月曜授業実施日

[商品サービスの企画・設計: QFD,VA, DFMなど]

第3回 【10月16日】

[生産管理の基礎(1)]需要予測、生産計画、工程計画等)、生産方式による重点の相違

第4回 【10月23日】

[生産管理の基礎(2)在庫管理―古典的 vs 現代的問題

第5回 【10月30日】

[生産管理の基礎(3)生産スケジューリング]

第6回 【11月13日】

[品質管理入門]

第7回 【11月20日】

[社会・環境配慮の製品設計の説明、研究開発における課題]

第8回 【12月4日】

[サプライ・チェイン・マネジメントと企業情報システムの歴史的発展]

第9回 【12月11日】

[2020年のサプライ・チェーンの課題 -先進国の課題]

第10回 【12月18日】

[2050年問題]日本の地域生活インフラとしての生産流通を考える

第11回 【12月25日】

[レポート発表]日本の地域生活インフラとしての生産流通を考える

 

本日のお品書き

  1. 製品flow特性
  2. 注文の分類
  3. プロセス選択
  4. 製品ープロセス選択
  5. 集中生産
  6. マスカスタマイゼーション
  7. 業務間提携による意思決定

製品flowの種類

-line型

大量生産品目を稼働率が高いまま作りたいとき

(設備投資が高額になりがち)

-batch型

汎用生産したい(柔軟にいろいろと生産したい)とき

(生産スケジュールに留意しないとボトルネックが生じ待ち時間が長くなってしまう)

-project型

uniqueで創造的な生産をしたいとき

(事前の計画とスケジューリング、自動化などが困難になるが、高度な特定のスキルを持った人間が集まることでより良いものができる可能性が高い)

製品flowによって在庫が異なるのはなぜか?

一連のプロセスは「活動」「バッファ」であらわされる

プロセス間の性能差があるほど、それを緩衝するためにバッファとして在庫を持つ

 

顧客注文のタイプ別分類

  • 見込み生産

完成品を生産しておき、顧客は在庫を購入する(一般的な店舗で購入する製品)

利点:継続的に生産可能

欠点:在庫を抱えることになるので、維持コストおよび売れ残りリスクがある

  • 受注生産

顧客から注文を受けてから生産

利点:在庫を抱えずに済む

欠点:生産が断続的になってしまいがち

  • 受注組み立て生産

部品や半製品は生産しておき、顧客の注文に合わせて完成品を組み立てる

利点:少ない在庫で迅速なサービスが可能

欠点:最低限の在庫が必要

→見込み生産と受注生産の中間と考える