2017秋学期 月曜 コンピュータシステムとネットワーク 2週目
前回までのあらすじ
コンピュータの歴史と構成
三つの特徴
- 高速計算:秒間 数百億回以上
- 正確計算:人のように計算ミスが起こらない
- 大容量記憶:あらゆる形式のデータを大量に保存できる
現在までの歴史的経緯
第一世代(1951-1957)
世界初のコンピュータがアメリカのペンシルベニア大学にて開発される(1946年)。軍事用に作られたそれは、ENIACと呼ばれ、論理素子として真空管を採用していた。1951年に世界で初めて商用化され、コンピュータが世界に飛び立つことになる。※世代とは、論理素子ごとに分けられる
(これの違いにより、根本的な計算速度の飛躍的向上が見られる)
第二世代(1958-1963)
論理素子としてトランジスタやダイオードを採用。USSC(universal solid state computer)は史上初の半導体コンピュータである。ここから、あのIBMが開発に参加してくる。(IBM7090,1958年 IBM1401, 1959年など)
第三世代(1964‐1974)
このあたりから半導体集積の技術が飛躍的に発展し、ICとLSIを論理素子として採用するようになる。これにより、回路の小型化・処理速度の高速化・信頼性の向上という恩恵が得られた。IBMシステム360(1964年)は世界的に注目され、後継のIBMシステム370では計算速度がマイクロ秒からナノ秒へ進化した。
この世代から超高速計算用のスーパーコンピュータ(CRAY-1)の開発、高級言語の開発(BASIC言語、FORTRANなど)が行われた。
第四世代(1980‐現在)
ICのさらなる進化により、論理素子としてVLSI(very large scale integration:超大規模集積回路)を採用する時代になった。また、磁気ディスク・磁気テープ・光ディスクなどの周辺装置の性能も向上し、仮想記憶やマイクロプログラムといった技術の開発も行われた。
ここに来て初めて、家庭用コンピュータ(PC)が登場する。C言語、Pascal言語などの高級言語も登場し、急速に普及していく。
第五世代(研究段階として1992‐)
※論理素子云々の基準は、ノイマン型コンピュータについて当てはまるものである。第五世代では、コンピュータそのものの型を変えてしまおうというアプローチがなされている。以下に例を挙げる。
ノイマン型コンピュータでは0,1の二値しか扱えない(bitであらわされる)
しかし、量子コンピュータでは「量子ビット」(quantum bit; qubit)を用いることで、量子ビットがn個あるとき、2のn乗の値が扱えることになる。そのため、数千qubitの量子コンピュータが開発された場合、これまでのコンピュータを軽く超える並列処理能力を得ることになる。
ノイマン型コンピュータは人の感覚器を模倣して作られている。ニューロンコンピュータでは、ヒトの脳の神経組織(ニューロン)を模倣して計算する。ニューラルネットワーク制御を基本理論とする。
デオキシリボ核酸 (DNA) の4種類の塩基を演算素子にして計算をする。そのため、並列して膨大な計算ができるとされる。現在のコンピュータが苦手とする組み合わせ問題などに効果が期待できるらしい。
コンピュータ内部では、なぜ二進法が採用されているのか
(授業時に聞くこととする)
次の週 ↓
2017秋学期 金曜 自然言語解析基礎 1週目
【重要な連絡】次回までの課題
1.自然言語処理ツールのうちの1つを触った感想を送る
2.言語処理学会のページにアクセスし、NLPの研究動向をまとめる
PDF / MSword 1ページ程度
メールにベタがきはダメ!
宛先 mail: yohei@slis.tsukuba.ac.jp
サブジェクト: nla2017-kadai1006
〆切 10/12
資料配布
http://cu.slis.tsukuba.ac.jp/class/nla2017/
u:nla2017,p:図書館情報メディア研究科2017
授業の「翌日に」内容をまとめたスライドを配布
授業はメモを取り、あとで復習すること
授業概要
人間の日常言語の内容を計算機で解析する自然言語解析は、機械翻訳、Web 検索、対話システム、質問応答、音声認識、仮名漢字変換などで実用的な成果をあげている。本講義は、自然言語処理の概要、形態素解析、言語モデル、構文解析、意味解析など自然言語解析の基礎理論を幅広く講義する。
※出席確認は毎回授業後の課題を出すことで行う
目標
自然言語解析とは何であるかを理解する。
自然言語解析の基礎理論とモデルについて理解する。
成績評価
評価= (中間試験+期末試験)/2
欠席が4回以上→不可
中間試験or期末試験の未受験→不可
スケジュール
中間試験 11/01,75分,3限
(水曜日なので気をつける)
期末試験 12/22,75分,3限
1.形態素解析 10/13
コスト最小法に基づく日本語の形態素解析や隠れマルコフモデルに基づく英語の
品詞タグ付けについて
2.統計言語モデル 10/20
N-グラムモデルを用いた単語の予測技術について
3.形式文法 10/27
文脈自由文法について
(中間試験) 11/01
4.構文解析 11/17
アーリー法,CKY 法などの構文解析手法について
5.意味解析 12/01
確率文脈自由文法を用いた構文のあいまい性解消について
6.機械学習と自然言語処理の応用 12/08
シソーラスやを用いた語義の類似時計算や, 語義のあいまい性の解消技術について
7.自然言語処理とソーシャルメディア 12/15
ナイーブベイズ,SVM, 決定木によるテキスト分類や,CRF を
用いた情報抽出について
(期末試験) 12/22
参考書
自然言語処理とは?
位置づけ
人が言葉を理解するようにコンピュータが言葉を理解するには?を科学する
自然言語処理,NLP,情報科学の一分野
コンピュータ上で自然言語を処理し、機械翻訳や対話システムの実現を目指す
海外では、計算言語学 言語工学と近い分野を指す
目標
機械翻訳・対話インターフェース・検索エンジン等で用いられている基礎技術を理解
内容
形態素解析、統計的言語モデル、形式文法、構文解析の仕組みを理解する
意味解析、機械学習、応用事例と基礎技術との関係を掴む
自然言語とは?
人工言語との対比であり,自然発生的に話されるようになった言語
ex.プログラミング言語
自然言語処理におけるタスク
1.自然言語のテキストをコンピュータが意味解釈する
2.コンピュータが自然言語を自動生成
方向が逆ではあるが技術的には同じ!
→機械翻訳は上記の2つの融合
HOTな話題がある?
・ソーシャルメディアを通じたbigdataを扱うように
・対話エージェントの利用機会が増加
言語処理の理解に必要な知識
・単語の判別(形態素解析)
・意味の識別(コンテクスト理解)
・照応関係の解析(指示語や主語の補足)
ex.「泳げない」→誰が?(ゼロ代名詞照応)
・含意関係
自然言語処理の課題
・表記の曖昧性問題の解決(表記揺れ)
・単語区切りの曖昧性
・品詞の曖昧性
・語義の曖昧性
・構文の曖昧性
・文章全体の意味の曖昧性
モデルとアルゴリズム
・有限状態機械(オートマトン)
品詞を状態とするマルコフモデル
状態の探索、学習など
・文脈自由文法
構文と文法規則と辞書規則
・構文解析木
・機械学習によるクラスタリング
自然言語処理の歴史
1940〜
シャノン オートマトンとコード化
チョムスキー 形式言語と文脈自由文法
1957〜1970
記号論と確率論の対立
→1956:人工知能の概念が提唱
1970〜1983
記号処理の発展
・論理モデル
・自然言語理解(?)
・談話焦点、対話モデル
1983〜1999
確率論への回帰と発展
・有限オートマトンによる形態素解析
・経験主義的アプローチによる品詞のタグ付け
・言語データを利用した確率アプローチ
2000〜
機械学習から実用タスクへ
・大規模コーパスを利用した教師あり学習
・最近は、コストの点から、
教師なし学習および強化学習が発展
・統計的機械学習
自然言語処理の学会
・ACL がトップ
自然言語処理ツール
- mecab
- juman++
次回
2017秋学期 金曜 質的調査法 1週目
【重要な連絡】参考文献を選定せよ!
質的調査に用いた文献を各自一冊よむ(論文は不可)
各自で選び、10/22までに選びmanabaに登録
→okならばAが返信、そうでなければ連絡返信
選び方
※少しは授業内でも紹介
以下、シラバスより
授業概要
社会学・文化人類学における質的調査の柱であるエスノグラフィー (参与観察とインタビュー) に焦点を当てて、そのさまざまなアプローチを概観する。質的調査に基づいて書かれた文献に多く触れることで理論の応用方法を学ぶ。
目標
エスノグラフィーという手法についての基本的な理論と近年の議論を理解し修得した上で、学生自身の研究において質的調査を用いることができるような実践的な技術を身につけていくこと
スケジュール
1) オリエンテーション・質的調査とは何か
2) 研究計画を立てる
3) 質問紙・同意書を作成する
4) インタビュー調査をおこなう
5) データを分析する
6) 成果をまとめる・研究における課題を克服する
7) 質的調査の理論的背景 1
8) 質的調査の理論的背景 2
9) 質的調査の理論的背景 3
10) まとめ
評価基準
出席およびコメントシート
期末試験は書籍を一冊持ち込み
それについて記述あり
全体として主に記述形式
教科書
質的調査法とは?
実地調査を行うための手法の1つ ⇔ 量的調査法 (正反対の手法)
ポイント
- 部分的に精緻に捉える
- インタビュー、参与観察(少数に絞られる)
- 内容分析、言説分析
※一部がこうだったから演繹的にこうであると言える!という結論には出来ない
両方の側面を持つ調査をもとに研究していくのが理想
意義について
- 全体の傾向を数字だけでは捉えにくいような意識や価値観、行動規範などを明らかにする
- 量的調査における常識を問い質す(ex. 人口調査におけるエスノシティ)
- 「個人の物語」を見ていくことで、より大きな問題な起こり方を多面的かつ全体的に明らかにする(ex.貧困率の上昇)
欠点
- 扱うことのできるケースには限りがあり、それらが全体を代表しているか?については検討不可能
- 量的調査よりも多くの時間と費用がかかる
- 調査する人により大きく結果が変わる可能性(結果の普遍化及び一般化ができない)
つまり、質的調査方法で重要視されるのは
公平性と中立性
(量的調査では客観性)
- 一人ひとりの価値観や世界観を尊重しデータを扱う
- 恣意的なデータの切り取りを避ける
- できるだけ中立に描写(ジャーナリズム)
調査の進め方
- 研究計画の立案(目的、対象、期間、内容など)
- 質問紙と同意書の作成
- 調査実施
- 結果の集計分析
- 結果の発表
重要用語
- フィールドワーク…参与観察を実施する現地調査
- フィールド(フィールドサイト)…↑を行う場所、コミュニティ、団体
- ラポール(を確立する)…フィールド内の人々との信頼関係
- インフォーマント…調査対象者、被験者、実験参加者、調査協力者
- フィールドノート…調査者によるフィールドワークの記録
- エスノグラフィ…(調査方法としての)フィールドワークのこと、またその研究の成果のこと(論文および文献)
そもそもの文化人類学におけるフィールドワークとは?
異なるサイトに赴いて、政治経済および人間関係、信仰、娯楽など、調査対象者の生活のあらゆる側面に渡る資料を集めることが目的だった
→すなわちそれがその文化を知る、ということだと考えられていた
ラポールの濃淡
→調査対象者との関係のこと
1.完全な参加者
→オーバーラポール
2.観察者としての参加者
→参与観察
3.参加者としての観察者
→インタビュー
4.完全な観察者
→非参与観察
研究で質的調査をする予定の人へ
テーマ設定ののちにフィールドに入ることになるが、実際に現場に入るとテーマがずれてくることがある
→ その場合、固執しないこと、先入観をもたないことが大切!
データを集めた後、どのように分析するのか、結論付けるのかはむずかしい、が、凡庸な調査と鋭い調査を分かつことが重要
現実は思った以上に複雑、その複雑さを矮小化しないこと!!!
単純なストーリーを仮定しない!
中立に公平に、複雑に要素が絡んでいることを知ろう!
今日の本紹介
www.amazon.co.jp
www.amazon.co.jp
次回
2017秋学期 水曜 図書館建築論 1週目
出席について、一時間目の講義の後に、簡単な小テストを行い、それをもって代わりとする
テストはない模様(やったぜ)
これを書いているのが授業から2日経ったあとなので、なにか書き漏れがあるような気がしてならない
もしあれば、来週また追記する
以下、シラバスより
授業概要
図書館の役割と社会的使命を考察する。具体的には、図書館建築のサービス内容や利用者の行動に与える影響およびそれらを踏まえた計画手法を学ぶことにより、公共サービスの担い手である職員が自発的に場の形成に取り組めるようにする。
目標
図書館の仕組みと建築の密接不可分の関係性を理解するとともに、建築に対する見分を養う。
スケジュール
1) オリエンテーション
2) 世界の図書館・日本の図書館
3) 本・人体・書架・空間
4) 場所と建築
5) 図書館サービスと建築
6) 図書館空間のつくり方 1
7) 図書館空間のつくり方 2
8) 図書館の企画から開館まで
9) 演習 (図書館建設の計画)
10) 講義のまとめ
教科書(いらないかも)
指定参考書籍
次回
2017秋学期 月曜 生涯学習と図書館 1週目
ユニオン講義室にて行う
スライド転換が素早いらしい[未確認]
スライド資料の配布は無し、聞いてメモってもらうことに重点
指定文献というものがあり、授業の度にそれを読んでくることが前提になる
(あまり長いものではないし読むべき;pdfで配布@manaba)
毎週manaba上でレジュメの配布も行われる
(印刷せよとのこと)
出席表も配られるが、表は個人の特定程度で、裏面のコメントが非常に重要になってくる
きちんと記述すること
以下、シラバスより
授業概要
生涯学習の意義、関連法と社会教育行政、生涯学習施設の運営、他機関との連携、海外の生涯学習の動向について概説する。図書館における生涯学習の支援の在り方について、国内と海外の事例を幅広く学ぶ。
目標
1) 講義を通して、生涯学習活動に関わる基本的な知識を修得する。
2) 生涯学習者を取り巻く現代的課題を踏まえて、生涯学習プログラムを計画・実施していくための基本的スキルを修得する。
授業外での学習方法
予習:次回の教材に目を通し、概要をつかんでおくとともに、指定文献を必ず事前に読んで理解しておく
復習:授業で紹介した web サイトや文献を通覧する。
スケジュール
第 1 回 生涯学習論の理念・意義・歴史:
海外における生涯教育の展開、日本における社会教育の展開
第 2 回 生涯学習の歴史- 1: 海外における生涯教育の展開
第 3 回 生涯学習の歴史- 2:日本における社会教育の展開
第 4 回 社会教育行政の意義と施策- 1:教育に関する法律、生涯学習行政と社会教育行政
第 5 回 社会教育行政の意義と施策- 2:自治体の行財政制度と生涯学習振興施策
第 7 回 海外の生涯学習 :北アメリカ (コミュニティカレッジ等)
第 8 回 生涯学習と図書館- 1:日本
第 9 回 生涯学習と図書館- 2: 海外
第 10 回 図書館における生涯学習の課題と展望・生涯学習プログラムの評価
指定参考書籍
次回
2017秋学期 月曜 コンピュータシステムとネットワーク 1週目
すべての情報発信源は以下の公式ページから行われる
manaba等も更新されるが個々の情報が最新になる
(twitter垢もある→ 担当授業情報bot (@sakalabLectures) | Twitter )
※以下、2017年度授業シラバス参考のこと;
授業概要
”コンピュータシステムとネットワークについての基本構成と動作原理を学ぶ。ハードウェア、ソフトウェアの各構成要素、システム間のデータ送受の基本的な手順と通信規約の役割を概説し、最後にコンピュータシステムとネットワークの組み合わせ事例を示す。"
目標
・コンピュータのハードウェア構成
・コンピュータソフトウェア
・コンピュータネットワークとプロトコル (通信規約)
を理解すること
授業計画
1) コンピュータの基本構成
2) コンピュータにおける情報の表現とその処理
3) 記憶装置と入出力装置
4) ソフトウェア
5) コンピュータネットワークとプロトコル
6) インターネットとは
7) ネットワーク事例: WWW と電子メール
8) セキュリティなど諸問題
以上の項目について教科書に基づきながら、身近な事例や自らがコンピュータシステムを使う上での tips など教科書には載らないような話題も交えた解説を行う。またインターネットの広がりを実感してもらうための PC 操作等も解説する。
教科書(指定・必須)
この内容に沿って講義されるため不可欠
次回
2017秋学期 木曜 量的調査法 1週目
次回までの宿題:
2017/09~ の内閣支持率に関する世論調査を"ふたつ"調べて、それらの「調査主体」「調査方法」「調査時期」「支持率」の四点について、2社分をmanabaのアンケート機能で回答する
この授業について
前半は講義で後半はIBMのSPSSを使う演習形式(全学計算機限定)
※ 以下のリンクでは、かなり詳しく量的調査に関する説明がある
参考:http://www.tuins.ac.jp/~ham/jyugyou/sw/ws31.html
以下、シラバスより概要抜粋
"授業概要:
質問紙調査の企画、標本抽出の方法、調査票の設計、調査の実施、作表とグラフ化、クロス集計と仮説検定など、質問紙調査と分析のための知識を講義する。
学習目標:
- 一般的な量的調査の方法を理解し, その結果をクリティカルに評価できる。
- 量的調査の企画と実行のための基礎知識を身につけ, 適切な指導の下で調査ができる。
- 調査結果の情報処理手順を理解し, 定型的な報告書を作成することができる。
授業進行計画
1) ガイダンス, 質問紙調査の方法 (10/04)
2) 標本の抽出方法
3) 調査テーマの設定
4) 調査票の作成 (1)
5) 調査票の作成 (2)
6) 結果の入力
7) 結果の単純集計・グラフ化
8) 結果の集計・分割表
9) 結果の集計・相関
10) まとめ (12/14)
(12/21 予備日)
教科書
"
社会調査法
社会学、政治学、経済学、経営学、人類学をはじめとした社会に関する学術・産業において用いることが多い。
内部関与法
社会の内部で何らかの役割を果たしながら得た情報を基にする手法
外部観察法
なるべく社会に影響を与えないように情報を得る手法
この際に、何らかの質問を行うことは"外乱"であり行動そのものへの影響があるため、それらデータを分析する段階で調査方法への影響を評価する必要がある
結果の分析法により大別すると…
統計的社会調査(量的調査)
大量のデータから全体像を数値として把握し分析し判断する
国勢調査(全数調査)や無作為抽出調査(標本調査)などがある
事例的社会調査(質的調査)
インタビューなどを行い、少数のデータから数値以外の情報から分析し判断する
※アンケートとの違い
和製英語としての「アンケート」は一般人を含めて意見を求める標準語であり、学術用語としては避けるべき
定量的アプローチ
多数の事例について少数の側面を客観的に把握する方法
調査票調査など
定性的アプローチ
(メモしそびれた、あとで調べなおす)
構造化・半構造化
社会調査の目的別分類
官庁統計,市場調査,世論調査,学術調査etc...
調査を実施する前に決めておくこと
- 目的・テーマ …何のために何を調べるのか(仮説)
- 予算
- 調査対象・規模
- 調査期間
- 調査方法
- 分析方法…仮説に沿ってデータの特性を見て検討すべきモデルを想定し、それに相応しい方法を用いる