「コーパス日本語学の創成」研究発表会

【重要】 3月11日に起きた地震の影響で,今回の研究発表会は中止いたします。

プロジェクト名
コーパス日本語学の創成 (略称 : コーパス日本語学)
リーダー名
前川 喜久雄 (国立国語研究所 言語資源研究系 系長,教授)
開催期日
平成23年3月17日 (木) 14:00~17:00
開催場所
国立国語研究所 2階 多目的室

発表概要

「BCCWJのデータを日本語能力試験に使うなら―大規模言語テスト、多変量解析、コーパス」李 在鎬 (国際交流基金 日本語試験センター 専門研究員)

本発表では,大規模テストの問題作成におけるコーパスの利用可能性を考察した。考察においては言語テスト分野におけるコーパス利用の現状を紹介した後,試験問題の作成過程でコーパスを用いる利点について述べる。そして,読解の問題作成での利用を想定し,日本語能力試験の級区分に基づくコーパスデータの分析を試みた。分析においては,日本語能力試験の読解テキストを学習用データ,『現代日本語書き言葉均衡コーパス』の収録データを評価用データにし,判別分析を行った。この分析から『現代日本語書き言葉均衡コーパス』の収録データが1級から4級のどの級に相当するかを明らかにする。

「大規模日本語コーパスから得られた言語データの分類 : 統計手法をどう生かすか」石川 慎一郎 (神戸大学 准教授)

近年,コーパスの大型化が進み,研究者は大量の言語データを手にすることができるようになった。しかしながら,大量のデータをそのまま質的に解析することは難しく,データの一次処理として,なんらかの「分類」を行うことになる。
分類に関連した統計手法としては,クラスター分析・主成分分析・因子分析・コレスポンデンス分析などさまざまなものがあり,それらを用いた言語研究も次第に増えているが,関連する手法間の関係性についてはまだ十分に整理されていないように思われる。
本研究では,各手法の概略を紹介した後,BCCWJ から得たサンプルデータを用いて上記の点を考察することとしたい。

「対談番組のマルチメディア・コーパスを用いた映像=談話分析の試み」石井 正彦 (大阪大学 教授)

言語 (音声文字化データ) と映像とを同期させ,言語形式とその発話場面の映像・実音声とを双方向に検索できる「マルチメディア・コーパス」を試作した。本発表では,そのうちの対談番組のマルチメディア・コーパスを使って,映像のカット切り替えと談話のターン交替とがどのような関係のもとに進行するかを試行的に分析・検討し,言語と映像との関係性を考慮した新たな言語使用研究の可能性を探る。