関西言語学会 第44回大会 シンポジウム 「高度文法情報付きコーパスとその日本語研究への応用」

プロジェクト名・リーダー名
統語・意味解析コーパスの開発と言語研究
プラシャント・パルデシ (国立国語研究所 理論・対照研究領域 教授)
開催期日
2019年7月14日 (日) 13:30~16:30
開催場所
関西大学 千里山キャンパス 第2学舎 4号館 F402教室 (大阪府吹田市山手町3丁目3番35号)
交通アクセス
参加申し込み
どなたでも参加可能ですが,参加人数を確認するため,事前に n.nomura[at]ninjal.ac.jp 宛にお申し込みください。[at]を@に変えてください。
プロジェクトWEBサイト
https://npcmj.ninjal.ac.jp/?page_id=459

プログラム

第I部 : 概要とウェブ・インターフェースを用いた検索の例

イントロダクション
プラシャント・パルデシ (国立国語研究所),吉本 啓 (東北大学)

NPCMJ 開発の動機とその特徴について解説し,NPCMJ が柔軟で文構造――例えば,主節と埋め込み節の要素間の階層的依存関係――を反映した例文検索と文法情報抽出を可能にすることについて述べる。さらに,ウェブサイト上のインターフェースを使ってどのような言語データが収集可能かについて解説する。

「前提投射の統語コーパスでの検索」 窪田 悠介 (国立国語研究所),峯島 宏次 (お茶の水女子大学)

NPCMJ のウェブ・インターフェースを用いて前提 (presupposition) 投射の実例を検索した結果について報告する。埋め込み節,条件節,モーダルに埋め込まれた環境,の3つの条件で,累加的意味を表す前提トリガーの取り立て詞・副詞の「も」「まで」「再び」「さらに」を用いて実例を収集した。該当する語の言語学的分析や,言語学的知見にもとづく自然言語処理研究のためのテストセットを作るのに十分な量のデータが得られることを確認する成果が得られた。

第II部 : 統語コーパスを用いた文法研究

「名詞句と述語の共起関係から見たコーパス研究」 三好 伸芳 (実践女子大学)

文の述語がそれぞれ動詞,形容詞,および名詞である場合について,普通名詞,固有名詞,代名詞など語彙的性質の異なる名詞が主語として結びつくか否かについて,構文にもとづく検索を可能にする NPCMJ を利用して例文を収集し,検討を行う。文章ジャンルごとの偏り等を調べることにより,本コーパスが文体論研究や量的研究における文法情報検索の応用において効果的であることを示す。

「NPCMJコーパスをとおしてみる特定の統語環境における語彙の偏り」 井戸 美里 (国立国語研究所)

本発表では,NPCMJコーパスを用いることで,特定の統語環境に現れる語彙の偏りを観察することができることを示す。具体的には,「否定文の名詞述語文において,述語名詞の連体修飾節に副詞が含まれる場合」を検索し,それらの副詞を分類する。検索の結果,多くの場合において,副詞が否定の焦点になっていること,NPI副詞 (「あまり」「そんなに」等) のほか,高い程度を表す程度副詞 (「とんでもなく」「格別」) などが多く現れていることがわかった。さらに,この検索結果に基づいてより規模の大きいコーパスである BCCWJ を用いて,これらの副詞の分布的特徴をより詳しく調査した。

第III部 : プログラミングを伴う言語研究

「並列構文における主語句標識と文の意味解釈」 大久保 弥 (東京外国語大学)

並列構文での主語句の助詞の選択 (が,は,も) は,文の意味解釈 (対比,累加,等) と相関関係があると考えられる。この発表では,統語解析情報を基に複雑な条件を指定した上での例文の収集が可能であるNPCMJを用いて,その関係性を調査する。その中で,目的に沿ったデータ編集・整理方法の例として,ツリー構造を加工するツールである tsurgeon によるデータの変形や,表計算ソフトで扱える形式への変換方法を紹介する。最後に,この調査で明らかになった,並列構文での主語句標識の組み合わせによる文の意味解釈への影響を指摘する。

結び

研究へのコメント,討論
吉本 啓