第1回 語用論コーパス科研成果発表会 「『語用論的分析のための1000人自然会話コーパス』構築の趣旨と活用法」

プロジェクト名,リーダー名
日本語学習者のコミュニケーションの多角的解明
石黒 圭 (国立国語研究所 日本語教育研究領域 教授)
班名,リーダー名
日本語学習者の日本語使用の解明
宇佐美 まゆみ (国立国語研究所 日本語教育研究領域 教授)
主催
科研費基盤 (A) 「語用論的分析のための日本語1000人自然会話コーパスの構築とその多角的研究」 (研究代表者 : 宇佐美まゆみ)
国立国語研究所 機関拠点型基幹研究プロジェクト 『日本語学習者のコミュニケーションの多角的解明』
共催
言語社会心理学研究会 (SPLaD)
開催期日
2019年6月29日 (土) 10:30~17:30
開催場所
国立国語研究所 2F 講堂 (東京都立川市緑町10-2)
交通案内
参加費
無料

趣旨

このたび,第1回 語用論コーパス科研成果発表会 「『語用論的分析のための1000人自然会話コーパス』構築の趣旨と活用法」を,国立国語研究所にて行うことになりましたのでお知らせします。皆様のご参加をお待ちしております。

科研費基盤 (A) 「語用論的分析のための日本語1000人自然会話コーパスの構築とその多角的研究」2018年度~2021年度 (研究代表者 : 宇佐美まゆみ) では,語用論的分析に適した「1000人自然会話コーパス」を構築中です。昨年度2018年度8月31日には,『BTSJ日本語自然会話コーパス (トランスクリプト・音声) 2018年版』 (333会話) (以降,必要に応じて,『BTSJ自然会話コーパス』と略記) を公開しました。これは,オンラインから申請すれば,無償で受領できます。 (https://ninjal-usamilab.info/lab/btsj_corpus/) 本研究発表会の前に,コーパスを申請し,中身をご覧になっておくことをお勧めします。

現在は,主に,「初対面会話」と「友人会話」 (同性,異性) の条件統制された会話が中心になっていますが,今後,「小学生と成人の会話」,「観光コミュニケーション場面の会話」など,場面の多様性を拡大していく予定です。本研究発表会では,本科研の2018年度の成果と進捗を広く公開することによって,「自然会話コーパス」を活用した「語用論的研究」を促進することを目的とします。

談話研究,自然会話コーパス,教室談話コーパス,学習者コーパス等について興味のある方は,是非,奮ってご参加ください。

プログラム

10:00~10:30受付

10:30~10:40 開会挨拶
宇佐美 まゆみ (国立国語研究所)

10:40~11:20 「語用論的分析に適したコーパスとは?」 宇佐美 まゆみ (国立国語研究所)

近年,様々なコーパスが構築され,コーパス言語学や自然言語処理研究が盛んになっている。しかし,それらのコーパスや研究では,語用論的分析に重要な役割を果たす,「オーバーラップ」,「割込み」,「沈黙」,「話題の展開」,「あいづちの機能」等々,語用論的研究にとっては不可欠の情報が付されていないのが現状である。『BTSJ日本語自然会話コーパス (トランスクリプト・音声) 2018年版』は,言語形式の分析も可能であるが,それだけでなく,上記に示したような言語現象の語用論的分析を,定性的分析だけにとどめず,定量的分析も併せて行うことによって,より深い考察へと進化させることを企図して編纂されたものである。本発表では,語用論的分析に適したコーパスとはどのようなものなのかについて論じ,現在構築中の『BTSJ自然会話コーパス』を紹介するとともに,その活用法を提案する。

11:20~12:00 「『BTSJ自然会話コーパス』の全体的な特徴と今後のデータ拡充について」 宇佐美 まゆみ (国立国語研究所),山崎 誠 (国立国語研究所)

本発表では,まずは,2018年8月31日に公開した『BTSJ日本語自然会話コーパス (トランスクリプト・音声) 2018年版』 (333会話) の定量的観点からの全体的な特徴を紹介する。本コーパスは,「共同構築型」をとっているが故に,サブグループを超えて全体的にみると,データ属性のバランスが「均衡」しているとは言えない面がある。ただ,本コーパスは,基本的には,333会話全体を一括して分析するために編まれているのではないので,現状では,データの均衡性が保たれている「サブグループ」単位の分析を推奨している。本発表では,より具体的に,本コーパスの特徴を示すとともに,現在のコーパスの最大限の活用法を論じる。また,今後いかにデータの均衡化を図っていくかという拡張方針,また,それによってさらに広がる本コーパスの活用法についても提案する。

12:00~13:00 昼食休憩 (質問用紙の回収)

13:00~13:40 「小学生と成人の会話の収集と今後の研究可能性」 大塚 容子 (岐阜聖徳学園大学),宇佐美 まゆみ (国立国語研究所)

本プロジェクトでは,『BTSJ日本語自然会話コーパス (トランスクリプト・音声) 2018年版』のデータの多様化の一つとして,小学生 (母語話者) の会話の実態を調査していくことに着手した。児童の会話データ収集は,保護者の承諾も必要なことなどから,困難な点も多く,その結果,現在,公開されている会話データはほとんどない。そのような現状の中,本プロジェクトでは,貴重なデータ収集の機会を得ることができた。本発表では,昨年度に収集した『小学生と成人の会話』データについて,収集計画,条件などの収集法を紹介するとともに,いくつかの事例について紹介し,今後,どのような研究が可能になるかを提案する。

13:40~14:20 「インドの観光コミュニケーション会話の収集とその活用法」 重光 由加 (東京工芸大学),宇佐美 まゆみ (国立国語研究所)

本プロジェクトでは,データの均衡化を図るとともに,一方で,データの多様性も拡張していく予定である。その一つとして,今回は,インドにおいて,現地の人が,日本から来ている日本人に,観光地や食べ物などを説明する「やりとり」のデータを収集した。この種のデータは,日本語教育の現場にも直結するデータであり,別途,開発中の『自然会話リソースバンク (Natural Conversation Resource Bank : NCRB)』の「教材作成支援機能」を使って,教材化していくことも想定したデータである。今回の発表では,会話収集の状況や,屋外でのデータ録画の注意点などのデータ収集に関する具体的なノウハウも紹介しながら,今回のデータの分析の観点や活用の可能性などについて論じる。

14:20~14:30 休憩 (質問用紙の回収)

14:30~15:10 「『BTSJ自然会話コーパス』の形態素解析のための補助ツールの開発について」 山崎 誠 (国立国語研究所),宇佐美 まゆみ (国立国語研究所)

『BTSJ日本語自然会話コーパス (トランスクリプト・音声) 2018年版』は,最初に述べたように語用論的分析をより効率化,深化させ,「語用論的研究」を促進することを第一の目的として構築しているものである。一方で,これだけの大規模な「自然会話データ」があれば,計量的なアプローチ,コーパス言語学的アプローチ,自然言語処理的アプローチも,もちろん可能である。しかし,本プロジェクトでは,これまで主に「質的分析」を行ってきた語用論の研究者にも,形態素解析の結果を活用してもらうことを企図して,本コーパスの形態素解析を合理化するツールを開発中である。本発表では,開発したツールの現状を紹介し,今後の語用論的分析とその考察を,より深化させることを提案したい。

15:10~15:50 「『BTSJ自然会話コーパス』を用いた話者属性研究の方法について」 石川 慎一郎 (神戸大学)

母語話者研究,学習者研究を問わず,従来のコーパス研究の多くは書き言葉を分析対象としていた。しかし,言語の振る舞いの本質を考える場合,話し言葉の分析の重要性は言を俟たない。一般に,書き言葉の分析では,巨大なデータが利用可能であるため,個体差は捨象され,匿名的・一括的な処理がなされる。しかし,より小規模なデータを扱うことの多い話し言葉研究では,個体差をどう扱うかが課題となる。本発表では,石川 (2018a,2018b,2019他) での議論をふまえ,『BTSJ日本語自然会話コーパス (トランスクリプト・音声) 2018年版』に含まれる母語話者大学生の会話データを素材として,個体と属性群のずれの位相について論じる。

15:50~16:30 「『BTSJ自然会話コーパス』に基づいた対話システムの構築にむけて」 片上 大輔 (東京工芸大学),宮本 友樹 (東京工芸大学)

SiriやGoogle Home,Amazon Alexaなど,自然言語を発話し人間を支援するシステムが一般的になってきた。しかしながら,未だ人間同士のような発話のやりとりには及ばない。そこには,相手の立場や状況に応じた柔軟性や,配慮など実現が難しい問題がある。一方,語用論やポライトネス理論など言語研究ではこれらについて古くから研究が行われてきた。このような知見に基づいた語用論的分析データを用いることで人間の発話における新しい領域における学習が可能となり,今後の人工知能や対話システムが真に人間のような柔軟な発話を実現する可能性が期待される。本発表では,人工知能分野からの視点から,『BTSJ自然会話コーパス』に基づいた対話システムの可能性と現在の取り組みについて議論する。

16:30~16:40 休憩 (質問用紙の回収)

16:40~17:20 パネリスト間,フロアとの討論,質疑応答
コーディネーター : 宇佐美 まゆみ (国立国語研究所)

17:20~17:30 全体の総括

17:30 閉会挨拶

お申し込み方法

受付は締め切りました。お申し込みありがとうございました。

締め切り : 6月25日 (火)

いただいた個人情報は,個人情報保護ポリシーに則り厳正に扱い,受付事務および催し物のご案内以外には使用いたしません。

会場の都合で,締め切りとさせていただく場合もありますので,どうぞお早めにお申込みください。
席に余裕がある場合は,当日の参加も可能です。

お問い合わせ先

国立国語研究所 宇佐美まゆみ研究室事務局
usamiken.jimu[at]ninjal.ac.jp

メールアドレスの「[at]」を「@」に置き換えてください。