「文脈情報に基づく複合的言語要素の合成的意味記述に関する研究」研究発表会発表内容「概要」

プロジェクト名
文脈情報に基づく複合的言語要素の合成的意味記述に関する研究 (略称 : 合成的意味記述)
リーダー名
山口 昌也 (国立国語研究所 助教)
開催期日
平成21年12月28日 (月) 13:30~17:00
開催場所
国立国語研究所 1階 中会議室1

発表概要

「プロジェクトの概要と合成的な意味記述」 山口 昌也 (国立国語研究所 言語資源研究系 助教)

本発表では,プロジェクトの概要を説明するとともに,分布仮説に基づいた合成的な意味記述の研究計画を示した。まず,プロジェクトの概要については,分布仮説に基づいた自然言語処理 (シソーラスの自動構築,多義語の曖昧性解消など) について概観したあと,(1) 合成的な意味記述への展開,(2) 言語学的立場からの自然言語処理結果の検証,の計画を説明した。次に,分布仮説に基づいた合成的な意味記述については,語彙概念構造 (LCS) など既存の手法と比較することにより,その特徴を明確にした。さらに,当該領域の最近の研究として,Vector Space Model への構文的情報の導入や,多義性を考慮した合成手法について概観した。最後に,今後の研究の方向性として,表層上現れない関係の Vector Space Model への導入手法,三つ以上の要素の合成手法を検討した。

「助動詞の多義性に関わる言語学的分析と自然言語処理との関連性」 北村 雅則 (名古屋学院大学 講師)

本発表では,助動詞の多義的な用法を分析する際に用いられる言語学的観点や手法を紹介し,言語学的な要因分析が自然言語処理の分野とどのような関わりを持てるか,関連性と方向性を示唆した。日本語学 (特に現代日本語文法研究) は,文法的に適格な文とは何かということに関心を持ち,コーパスから得た用例や研究者自身による文法性判断をもとに分析している。文法性判断や意味の曖昧性判断とはネイティブ (または,ネイティブに近い言語運用能力を持つ人) にとっては暗黙 (implicit) のものであり,これを意識化・明示化 (explicit) することが日本語学の目標の1つである。一方,自然言語処理では言語運用能力のないコンピュータに,explicit な形で知識を学習させ,処理を試みる。機械でも処理できる explicit な情報として,日本語学からどのような知見が提案できるか,お互いの情報交換と適用可能性を探るための下地作りから始めることを提案した。

「文法形式の意味・用法をどうとらえるか」 井上 優 (国立国語研究所 言語対照研究系 教授)

文法形式の意味・用法の分析をおこなう過程で常に問題になる点について述べた。特に複数の表現が「共起」することの意味合いが日本語と中国語とでは事情が異なることを述べた。二つの言語表現 X, Y が共起可能なのは,X と Y の文法的・意味的性質が矛盾しない場合であるが,中国語にはそれがあてはまらないように見える現象がある。中国語の持続相を表す動詞接尾辞"着"は持続の局面を持つ動詞にのみつく。瞬間的な変化を表す"破" (破れる,割れる) は"*破着"という形は成立しない。しかし,副詞"還" (まだ) や変化のない静的場面を現す終助詞"ne"による支えがあれば,"還破着ne" (まだ破れたままだ: 張麟声2001) という表現が成立する。これは,"破着"は潜在的には可能だが,副詞等の支えがないと成立しないということだと思われる。中国語では,「共起」は単に「文法的・意味的性質が矛盾しない」という以上の意味を持つのである。

「コーパスと辞書に基づく意味解析」 白井 清昭 (北陸先端科学技術大学院大学 准教授)

発表者がこれまで取り組んできた意味解析に関する3つの研究事例を紹介した。1つめはコーパスと辞書を併用する語義曖昧性解消の手法である。コーパスから機械学習された分類器と,辞書の定義文を基に語義を判定する分類器を作成し,それらの出力を組み合わせることで語義曖昧性解消の精度・再現率が向上した。2つめは特に低頻度語を対象とした語義曖昧性解消手法の手法である。この手法の基本的なアイデアは,辞書の定義文から自動抽出された上位概念と周辺文脈との関連性を機械学習することにある。3つ目はコーパスから単語の新しい意味や用法を発見する手法である。まず,コーパスから取得した複数の用例に対してクラスタリングを行う。次に用例クラスタと辞書の語義との類似度を定量化する。最後にどの辞書の語義とも類似度が低いクラスタを新語義の用例の集合とみなす。

「コーパスを用いた「一般名詞」の意味記述の方法概観」 千葉 庄寿 (麗澤大学 准教授)

「一般名詞」general nouns は,代用辞的な機能をもち,テクストの結束性に貢献するダイクシスの一つである。指示詞による文法的結束性と語彙の選択による語彙的結束性のボーダーラインケースとして Halliday & Hasan (1976) によりその重要性が指摘されて以来,コーパスを用いて「一般名詞」を精密に記述する試みが行われてきた。本発表では,英語の一般名詞の分析である Partington (1998),Hunston & Francis (2000),Mahlberg (2005) および類似の試みである Schmid (2000)などが提案しているコーパスを用いた一般名詞の意味記述の枠組みと課題を考察し,大規模日本語コーパスを用いた今後の研究の方向性について検討した。