「近代語コーパス設計のための文献言語研究」研究発表会発表内容の「概要」

プロジェクト名
近代語コーパス設計のための文献言語研究 (略称 : 近代語コーパス)
リーダー名
田中 牧郎 (国立国語研究所 言語資源研究系 准教授)
開催期日
平成23年9月23日 (金) 13:30~17:00
平成23年9月24日 (土) 10:30~12:00
開催場所
岩手大学 学生センター B棟 多目的室 (〒020-8550 岩手県盛岡市上田三丁目18番8号)

発表概要

「『太陽コーパス』の可能表現形式 ―形態素解析結果を用いた記述の精密化」小木曽 智信 (国立国語研究所 准教授)

『太陽コーパス』には多様な可能表現形式が現れるが,言文一致の流れの中で淘汰を経て,現代語で用いられる諸形式に収斂していく。本発表では,形態素解析を施したコーパスのデータをデータベースに取り込み,SQL によって可能表現を収集・集計する手順を示した。この方法で得られたデータを生かして,ジャンル・文体・上接語などの観点から,近代において可能表現形式がどのように変遷していくかを考察した。

「明治前期雑誌の異体漢字と文字コード」須永 哲矢 (国立国語研究所 プロジェクト奨励研究員),高田 智和 (国立国語研究所 准教授)

『明六雑誌』『国民之友』に出現する異体漢字の実相を報告し,近代語コーパスの文字処理のあり方について検討した。両誌に出現する漢字字形には,現行の JIS 包摂規準のままでは外字処理となるものが多く含まれるが,それらをすべて外字「〓」として処理するのは,コーパスとしての実用面から望ましいことではない。また,出現する異体漢字の多くは通用字体に比してわずかな字形差といえるものであった。そこで近代語での文字処理用に包摂規準の拡張案を作成・提案し,拡張した基準に基づいて文字処理していくことで,コーパスとして実用的な程度に外字処理を減らしていこうという方向性を示した。

「近代語末期資料の探索と選定」小野 正弘 (明治大学)

コーパスの対象となる近代語研究資料を考えていく際には,最後の着地点,すなわち,近代語末期の資料をどう設定して,どのように現代語のコーパスに渡していくのかという点も,あらかじめ考慮しておかなければならない。本発表では,まず,日本語史の時代区分のなかで近代語をどのように位置づけるかについて考察した。その後,雑誌『新青年』に見られる文法現象と,佐々木邦の小説の用語を例として,近代語コーパスの最後の時期の文献を選定する際の観点をいくつか取り上げて検討した。