「文脈情報に基づく複合的言語要素の合成的意味記述に関する研究」研究発表会

プロジェクト名
文脈情報に基づく複合的言語要素の合成的意味記述に関する研究 (略称 : 合成的意味記述)
リーダー名
山口 昌也 (国立国語研究所 助教)
開催期日
平成22年12月27日 (月) 13:30~17:30 (非公開)
開催場所
国立国語研究所 1階 中会議室2

発表概要

「用例クラスタと語義の対応付けに基づく新語義の検出」白井 清昭 (北陸先端科学技術大学院大学 准教授)

我々の研究室では,用例をクラスタリングし,作成されたクラスタが新語義の用例をまとめたものかを判定することで,単語の新しい意味を発見する研究に取り組んでいる。今回は新語義判定の新しい手法について報告する。新手法では,クラスタ集合と辞書の語義の集合(新語義を含む)が与えられたとき,クラスタと語義を対応付ける問題を解く。この際,クラスタとそれに対応付けられた語義の類似度と,同じ語義に対応付けられるクラスタ間の類似度の重み付き和によって対応付けのスコアを決める。クラスタと語義の類似度だけでなく,クラスタ間の類似度も考慮することによって,語義の対応付けならびに新語義判定の正解率向上を狙う。SemEval-2日本語タスクのデータを用いた提案手法の評価実験についても報告する。

「形容詞による連体修飾と連用修飾について」北村 雅則 (名古屋学院大学 講師)

本発表では,「名詞ガ動詞」「名詞ヲ動詞」という構文における形容詞の連体修飾と連用修飾について考察をする。奥津 (2007) が指摘するように,形容詞の連体修飾と連用修飾は,例えば「大きい字を書く / 字を大きく書く」や「*早い借金を返す / 借金を早く返す」のように論理的な意味を変えずに相互に入れ替え可能な場合と不可能な場合が存在する。なぜこうした入れ替えが可能なのかは,奥津によって明らかにされつつあるが,いまだ解明されていない部分も多い。奥津は基本的に作例による研究スタイルをとるが,本論でコーパスを使用した帰納的な手法を採用し,奥津の主張の検証と拡張を目指す。また,本論により得られた知見を自然言語処理にどのように活かせるかを模索する。

「用例に基づく複合動詞の構成分析 (試行) 」山口 昌也 (国立国語研究所 助教)

本研究では,実際の用例に基づいて,複合的な言語要素の意味記述を行う手法の確立を目指している。本発表では,複合動詞の用例とその構成要素の動詞の用例から,構文パターンの対応関係,および,意味の対応関係を分析した結果を報告する。分析では,まず,複合動詞と構成要素の動詞のそれぞれの格に対して,同一の格要素を取るか,というシンプルな判断基準に基づいて,構文パターンの対応関係の検出を試みる。さらに,対応関係が検出された場合の意味的な関係についても考察する。なお,今回の試行では,それぞれの動詞ごとに,1000例程度の用例を用意した。そのため,Web上から,用例を抽出するためのツールを作成した。本発表では,ツールの紹介とともに,収集された用例の性質についてもあわせて示す。