「テキストにおける語彙の分布と文章構造」研究発表会

プロジェクト名
テキストにおける語彙の分布と文章構造 (略称 : 語彙と文章構造)
リーダー名
山崎 誠 (国立国語研究所 言語資源研究系 准教授)
開催期日
平成23年3月6日 (日) 14:00~17:00
開催場所
国立国語研究所 3階 セミナー室

発表概要

「『手』の慣用句を指標とした文章の所属ジャンル判別の可能性
―現代日本語書き言葉均衡コーパスを用いて―」
村田 年 (慶應義塾大学 日本語・日本文化教育センター 教授)

本研究では慣用句を指標として文章ジャンルの判別の可能性を探る。「手」を含む動詞慣用句,形容詞慣用句 (74項目) を指標として用い,現代日本語書き言葉均衡コーパスの書籍文章資料を対象として「人文科学系」「社会科学系」「自然科学系」という三つのジャンルの判別を多変量解析法によって行った。その結果,5つの慣用句によって高率でジャンルが判別されることが分かった。

「接続表現の二重使用と文章ジャンル」馬場 俊臣 (北海道教育大学 教授)

接続表現 (接続詞及び接続詞的機能を果たす連語等) は文章構造分析の重要な指標の一つである。本発表では,接続詞の二重使用 (特に異種併用) と文章ジャンルとの関係について試行的・探索的な調査分析を行う。二重使用に関する先行研究の成果を踏まえ,『現代日本語書き言葉均衡コーパス』モニター公開データ (2009年度版) を利用し,「書籍」 (NDC 第1次区分別) 「国会会議録」「白書」「Yahoo! 知恵袋」の使用率の偏りを明らかにする。

「文節の語彙属性パターンに基づいた文体分析」 金 明哲 (同志社大学 教授)

文体の計量分析では,文章の中のどのような要素を特徴情報として用いるかが重要である。本研究会では,文節に含まれている語彙の品詞属性情報を用いた文節のパターンに基づいた書き手の識別方法を提案し,文学作品や作文データを用いた実証結果を報告します。