研究者宇佐美まゆみ,小川都,張未未
概要「自然会話リソースバンク(NCRB)」は,豊富な自然会話データ(映像・音声・文字化資料)を格納し,「研究(データ提供・利用)」と「教材(作成・利用)」の2つの機能を持つ現在開発中の「共同構築型多機能データベース」である。情報環境の発展と研究者,教育者の相互貢献を想定し,これからは,「コーパスの構築」も「教材の開発」も,関連分野の研究者・教育者が協働して構築していくという発想が必須である。NCRBは,その先駆的な試みであり,登録者は,「研究用データの提供・利用」と,「教材作成テンプレート」を用いた「WEB教材」の作成・利用ができるプラットフォームである。
研究者野山広,迫田久美子
概要I-JAS(International corpus of Japanese as a second language)は,国内外の日本語学習者1000名の発話と作文のデータを収録したコーパスである。海外の12言語の母語の日本語学習者と日本国内の留学生,就労者,外国人配偶者らによる約800万語のデータが収められている。日本語母語話者のデータもあり,学習者との比較から言語習得などの研究,日本語指導の実践,さらに他言語の学習者コーパスとの共同研究にも利用でき,様々な分野への活用が期待される。
研究者大西拓一郎
概要言語地図は方言の分布を表す地図である。言語地図を見ると,どこでどんな方言が使われているのか,一目でわかる。日本では約440冊,28,000枚もの言語地図が各地で作られてきた。これは世界最大規模である。ただ,これだけあると全体の把握が難しくなる。また,多くの地図集が国立国語研究所研究図書室に所蔵されているが,中にはあまり流布していないために簡単には見られないものや紙の劣化が進んでいる資料もある。言語地図データベースは,これらの検索と閲覧,そして保存を目的として作成されている。
研究者大村舞,石本祐一,岡照晃
概要主に,『中納言』をはじめて使う人のために,検索方法について紹介する。『中納言』では,コーパスを単語や品詞などの形態論情報を用いた検索が可能である。これが『中納言』の大きな特徴である。『中納言』の形態論情報を用いた検索方法について紹介する。また,文字列検索や,位置検索という検索も可能である。あわせて紹介する。
研究者岡照晃,石本祐一,大村舞
概要『少納言』『中納言』はいずれもコーパスを個別に検索するサービスであり,特に『中納言』には2020年7月現在,9種類の書き言葉や話し言葉,歴史,方言様々なコーパスが格納されている。ただし,『中納言』が提供するサービスは各コーパスを個別に検索するものであり,コーパス同士の検索結果の比較などはユーザ側で1つずつ個別に行う必要があった。まとめて検索『KOTONOHA』は,中納言に格納されているコーパス群を横断的に検索し,1つの画面で結果を確認できる画期的な検索システムである各コーパスの検索結果の統計情報をグラフ表示する機能を主に,各コーパス別の詳細な用例へのリンク機能も備えた包括的な検索サービスとなっている。
研究者岡照晃,石本祐一,大村舞
概要コーパス開発センターの提供しているコーパス検索サービス『中納言』『KOTONOHA』では,「単語」を条件にした検索が特徴である。ただし,英語のように単語間にスペースを置かない日本語において「何を単語とみなすのか?」という問題は古くから議論されており,決着はついていない。そこで『中納言』『KOTONOHA』では,「単語」に代わって「短単位」という言語単位(lexical unit)を設計・規定し,検索に採用している。ここでは,この「短単位」がどういったものであるのかを概説する。