「通時コーパスの設計」研究発表会
- プロジェクト名
- 通時コーパスの設計 (略称 : 通時コーパス)
- リーダー名
- 近藤 泰弘 (国立国語研究所 言語資源研究系 客員教授)
- 開催期日
- 平成25年7月28日 (日) 10:30~17:00
- 開催場所
- 国立国語研究所 2階 多目的室 (東京都立川市緑町10-2)
発表概要
10:30-12:00「日本語歴史コーパス 平安時代編」デモと解説小木曽 智信,冨士池 優美,中村 壮範
13:00-17:00研究発表
- 「『今昔物語集』巻12の語彙の考察 ―形態素解析の試行データの分析―」
田中 牧郎 (国立国語研究所) - 「The Oxford Corpus of Old Japanese and Differential Object Marking in Old Japanese」
Stephen Wright Horn (Faculty of Oriental Studies, University of Oxford) - 「日本語歴史コーパスの利用方法の開発」
近藤 泰弘 (国立国語研究所 客員教授)
「日本語歴史コーパス」に,平安時代から鎌倉時代の和漢混淆文の資料群を収録する準備を進める中で,その代表的作品である『今昔物語集』について,テキスト整形を行って形態素解析を施す試行を行った。本発表では,第一段階の作業を実施した,巻12の形態素解析データから見えてくる,平安時代語彙研究における課題について,「日本語歴史コーパス・平安時代編」に収録される和文資料の語彙と比較しながら検討する。
Using the Oxford Corpus of Old Japanese, a survey of the uses of the accusative case (based on attestations of the accusative particle wo written phonographically) was conducted, including object-marking, marking of other arguments, and adjunct-marking. With regard to object-marking, the contexts for the variable appearance of wo (Differential Object Marking, or DOM) are examined, and the data is found to be consistent with the hypothesis that objects that receive accusative marking (wo marking) in Old Japanese are 'specific'.
「日本語歴史コーパス」は今のところ,中納言のインターフェースを使って,KWIC コンコーダンスとして利用するのが一般的である。しかし,内部では XML でマークアップしてあるデータであるから,その構造を利用して,別のインターフェースによる利用方法もあり得る。今回の発表では,語彙の側面から使いやすいインタフェースを提案し,その実現に向けての方法論を考察する。