統語・意味解析コーパスの開発と言語研究」研究発表会 (2019年6月15日)

プロジェクト名・リーダー名
統語・意味解析コーパスの開発と言語研究
プラシャント・パルデシ (国立国語研究所 理論・対照研究領域 教授)
開催期日
2019年6月15日 (土) 14:00~18:00
開催場所
お茶の水女子大学 理学部 3号館 2階 ラウンジ 205 (東京都文京区大塚2-1-1)
交通アクセス・キャンパスマップ
参加申し込み
どなたでも参加可能ですが,参加人数を確認するため,事前に n.nomura[at]ninjal.ac.jp 宛にお申し込みください。[at]を@に変えてください。
プロジェクトWEBサイト
https://npcmj.ninjal.ac.jp/?page_id=459

2019年度 第2回 研究発表会 プログラム

14:00~14:30 「NPCMJコーパスの現状と今後の課題」 プラシャント・パルデシ (国立国語研究所),吉本 啓 (東北大学)

NPCMJ 開発の動機とその特徴について解説し,NPCMJ が柔軟で文構造――例えば,主節と埋め込み節の要素間の階層的依存関係――を反映した例文検索と文法情報抽出を可能にすることについて述べる。さらに,ウェブサイト上のインターフェースを使ってどのような言語データが収集可能かについて解説する。

14:30~15:00 「前提投射のNPCMJコーパスでの検索」 窪田 悠介 (国立国語研究所),峯島 宏次 (お茶の水女子大学)

NPCMJ のウェブ・インターフェースを用いて前提 (presupposition) 投射の実例を検索した結果について報告する。埋め込み節,条件節,モーダルに埋め込まれた環境,の3つの条件で,累加的意味を表す前提トリガーの取り立て詞・副詞の「も」「まで」「再び」「さらに」を用いて実例を収集した。該当する語の言語学的分析や,言語学的知見にもとづく自然言語処理研究のためのテストセットを作るのに十分な量のデータが得られることを確認する成果が得られた。

15:10~15:40 「統語情報付きコーパスから見た名詞句と述語の共起関係」 三好 伸芳 (筑波大学)

文の述語がそれぞれ動詞,形容詞,および名詞である場合について,普通名詞,固有名詞,代名詞など語彙的性質の異なる名詞が主語として結びつくか否かについて,構文にもとづく検索を可能にする NPCMJ を利用して例文を収集し,検討を行う。文章ジャンルごとの偏り等を調べることにより,本コーパスが文体論研究や量的研究における文法情報検索の応用において効果的であることを示す。

15:40~16:10 「NPCMJコーパスによる名詞述語文の名詞修飾節に現れる副詞の研究」 井戸 美里 (国立国語研究所)

本発表では,NPCMJコーパスを用いることで,特定の統語環境に現れる語彙の偏りを観察することができることを示す。具体的には,「否定文の名詞述語文において,述語名詞の連体修飾節に副詞が含まれる場合」を検索し,それらの副詞を分類する。検索の結果,多くの場合において,副詞が否定の焦点になっていること,NPI副詞 (「あまり」「そんなに」等) のほか,高い程度を表す程度副詞 (「とんでもなく」「格別」) などが多く現れていることがわかった。さらに,この検索結果に基づいてより規模の大きいコーパスである BCCWJ を用いて,これらの副詞の分布的特徴をより詳しく調査した。

16:20~16:50 「並列構文の意味解釈と主語句標識の選択」 大久保 弥 (東京外国語大学)

並列構文での主語句の助詞の選択 (が,は,も) は,文の意味解釈 (対比,累加,等) と相関関係があると考えられる。この発表では,統語解析情報を基に複雑な条件を指定した上での例文の収集が可能である NPCMJ を用いて,その関係性を調査する。その中で,目的に沿ったデータ編集・整理方法の例として,ツリー構造を加工するツールである tsurgeon によるデータの変形や,表計算ソフトで扱える形式への変換方法を紹介する。最後に,この調査で明らかになった,並列構文での主語句標識の組み合わせによる文の意味解釈への影響を指摘する。

16:50~17:10 研究へのコメント,総括 吉本 啓 (東北大学)

17:10~18:00 討論