プロジェクト概要

国立国語研究所で構築する「通時コーパス」の開発に先立ち,通時コーパスを設計する基礎的な研究を行う。古代から近世までのいくつかの時点における代表的 資料により,「通時コーパス」のモデルを試作しながら,次の三点を中心に研究を進め,実際に一部のコーパスの構築に着手する。

(1)どのような観点でコーパス化する資料を選定するか
(2)どのように古典本文を電子化し,どのような情報(異文・原文表記・異体字・引用・文体など)を付与するか
(3)各時代・各文体の語彙や文法に対応した形態素解析をどのように行うか

 

 

Share on Facebook

コメントは受け付けていません。