「コーパスアノテーションの基礎研究」研究発表会の発表内容「概要」

プロジェクト名
コーパスアノテーションの基礎研究 (略称 : アノテーション)
リーダー名
前川 喜久雄 (国立国語研究所 言語資源研究系 系長,教授)
開催期日
平成23年6月21日 (火) 14:00~17:00
開催場所
国立情報学研究所 (NII) 19階 1904室

発表概要

「動詞項構造シソーラスの構築と課題」竹内 孔一 (岡山大学大学院 自然科学研究科 講師)

動詞と動詞が取る項との関係を記述した辞書の構築について説明した。特徴的な点として,動詞の語義間に共通概念を仮定して,その粒度を自在に設定できるように階層化したこと。また,共通概念の意味を文書で記述するのではなく,ある程度形式化した形で,概念間の差分を中心に記述する手法について説明した。また,各概念と動詞の語義の例文の組み合わせにより,動詞の概念と項の組み合わせを記述する方法について説明した。この時,意味役割ラベルだけを利用していると見方の違いにより,意味ラベルが不整合となる。そこで,項を番号で記述し,概念と例文を対応させる手法を採用している,さらにデータ整理のために付与している意味役割ラベルについて,考え方と分類を事例と共に説明したまた,本提案シソーラスとオントロジーとの関係や,他の言語資源との関係についても説明した。

「ディスコースアノテーションの枠組み構築に向けて」佐野 大樹 (情報通信研究機構 ユニバーサルコミュニケーション研究所)

テクストにおいて,言語表現は単に羅列されているわけではなく,様々な文法的,あるいは,論理-意味的な関係を結ぶことで一つのディスコースを作り上げている。ディスコースにおける相対的な位置づけが与えられて初めて,テクストにおける言語表現の役割が決定されるわけである。このためディスコースレベルにおけるアノテーションは,語・句・節/文レベルでのアノテーションを包括する上でも重要な役割を果たすが,日本語においてディスコースアノテーションが施されたコーパスはほとんど構築されていない。この背景には,ディスコースアノテーションは多様な言語単位,表現の出現パターン,曖昧性などを扱う必要性があるため確立した枠組みを構築することが難しいということがある。本発表では,海外におけるディスコースアノテーションの研究,特に,選択体系機能言語理論 (システミック理論) における研究について説明しつつ,日本語におけるディスコースアノテーションの枠組み構築について検討した。