「多様な様式を網羅した会話コーパスの共有化」研究発表会 概要

プロジェクト名
多様な様式を網羅した会話コーパスの共有化
リーダー名
伝 康晴 (国立国語研究所 言語資源研究系 客員教授)
開催期日
平成25年10月20日 (日) 13:00~17:30
研究発表会 (公開) 13:00~15:00,研究打合せ (非公開) 15:20~17:30
開催場所
国立情報学研究所 22階2208会議室 (東京都千代田区一ツ橋2-1-2)

発表概要

「発話様式に基づくコーパス推薦を目指して」菊池 英明 (早稲田大学 教授)

言語学・工学などの様々な分野において音声言語コーパスの構築が盛んにおこなわれており,大量のコーパスの中から利用目的に適したコーパス検索のニーズが高まっている。本発表では,コーパスに含まれる談話の発話様式を言語情報の解析に基づいて自動的に推定することを目指して,小規模の実験と分析を行った結果を報告した。具体的には6つのコーパスの転記テキストから300字程度の部分を10か所ランダムに抽出し,人間による発話様式の評定を行った。評定の尺度としてはEskenaziの3尺度を用いた。評定結果を分析した結果,コーパスの特性による発話様式の違いがあらわれていることが確認できた。次に,テキストの形態素解析結果を用いた評定結果の回帰モデルを構築したところ,3尺度とも高い精度で推定できることを確認した。

「いわゆるゼロについて : 反応の動詞表現を中心に」鈴木 亮子 (慶應義塾大学 教授)

日本語では,話しことばにおいても述語のみの発話が多くみられ,いわゆる主語の省略として捉えることもある。自然会話の分析から,主語が省略されているのではなくもともとないということを数種類の発話群を挙げ,省略ではなくコンテクストの要請によって主語が補てんされるという捉え方を提示した。これらの例は程度に差はあれ多くが定型化した表現であり,述語のみの形で定着している。