国立国語研究所で構築する「通時コーパス」の開発に先立ち,通時コーパスを設計する基礎的な研究を行う。古代から近世までのいくつかの時点における代表的 資料により,「通時コーパス」のモデルを試作しながら,次の三点を中心に研究を進め,実際に一部のコーパスの構築に着手する。
(1)どのような観点でコーパス化する資料を選定するか
(2)どのように古典本文を電子化し,どのような情報(異文・原文表記・異体字・引用・文体など)を付与するか
(3)各時代・各文体の語彙や文法に対応した形態素解析をどのように行うか
研究目的
日本語の史的研究に用いることができる本格的な「通時コーパス」を構築する準備段階として,コーパスの設計にかかわる諸問題について研究する。①コーパス の対象に含める文献資料をどのようにして選定するか,②選定した資料をどのように電子化しどのような情報を付与するか,③古典テキストに対応した形態素解 析をどのように行うかなど,通時コーパス設計のための重要問題を中心に,基礎的な研究を展開する。こうした研究は,日本語史上のいくつかの時点の主要資料 についてコーパスを試作し,これを活用した日本語史研究を実践することを通して行う。 また,コーパスの構築作業における他機関との連携の可能性を探り,コーパス公開のために不可欠な著作権処理の問題についての検討も行い,通時コーパスの構 築・公開に向けた諸課題に見通しを付ける。
言語資源研究系の現代語コーパスにかかわる研究と連携を取り,コーパス開発センターで実施中の現代語コーパスの構築作業,著作権処理業務などとも関連付けて研究を進めていく。