「コーパス日本語学の創成」研究発表会

プロジェクト名
コーパス日本語学の創成」 (略称 : コーパス日本語学)
リーダー名
前川 喜久雄 (国立国語研究所 言語資源研究系 系長,教授)
開催期日
平成23年6月10日 (金) 17:00~20:00 (非公開)
開催場所
国立国語研究所 4階 405号室

発表概要

「理研日本語母子会話コーパスの紹介」五十嵐 陽介 (広島大学大学院 文学研究科 准教授)

乳幼児は母親や周囲の人間の話し言葉を聞くことにより言語を獲得する。言語獲得の入力となるこのような話し言葉は,「マザリーズ」(motherese) あるいは“Infant-Directed Speech”(IDS) と呼ばれる。IDS は大人に向けて話される言葉と異なることが知られているが,言語発達の研究のためには,IDS の性質を理解することが不可欠となる。本講演では,我々が言語発達の研究目的で構築した『理研日本語母子会話コーパス』を紹介する。この音声データベースは,母親22人による自分の子供 (17~24ヶ月) に向けた発話,および大人に向けた発話を格納している。このコーパスは,約14時間の音声信号とともに,転記テキスト,分節音情報,形態論情報,韻律情報を検索可能な形で与えている。

「AESOPコーパスの紹介」近藤 眞理子 (早稲田大学 国際学術院 教授)

英語は今や世界の共通語として使われており,アジアでは英語母語話者は勿論のこと,第二言語として日常的に英語を使用しているL2英語話者,また学習者を含めて,英語話者の人口が世界で一番多い。しかし,外国語としての英語教育の世界においては,World Englishes の概念はあまり浸透していず,いまだアメリカ,イギリスを中心とした,いわゆる inner circle の英語をモデルとした教育が行われている。しかし,従来型の inner circle をモデルとした英語教育や英語能力判定法を,英語圏とはいわゆる文法体系,音声体系,文化的背景の異なるアジア言語話者の英語習得,運用力を判定するのに使うのは必ずしも適切とは言えない。アジア英語自体の研究があまり進んでいないこともこのような現状をもたらした原因の一つであろう。
AESOP (Asian English Speech cOrpus Project) では,世界で一番話者人口が多いアジア英語話者の英語音声のデータを広く収集し,アジア英語を基準とした習得レベルの判定ができるよう,アジア英語の研究に役立てるコーパスの構築を目指している。
今回は,現在台湾,香港,中国,タイ,韓国と共に進めている,アジア英語の音声研究のためのデータ収集について紹介し,現時点での問題点,今後の課題についても合わせて考えたい。

「音声談話コーパスのRDB化」伝 康晴 (千葉大学 文学部 教授)

形態論情報・韻律情報・発話単位などさまざまなアノテーションが付加された音声談話コーパスを関係データベース (RDB) で表現する方法を紹介する。また,Excel・Praat・ELANなどによるアノテーション結果から RDB を自動生成するツールを紹介する。(時間があれば) RDBによる分析の初歩についても解説する。