国立国語研究所年

国立国語研究所オープンハウス2020

トップページ > 研究の紹介

発表

研究の紹介

「日本語研究の国際化―国立国語研究所の取り組み」
研究者窪薗晴夫
概要国立国語研究所が行っている国際化の取り組みを紹介する。国語研は (i)人的交流,(ii)機関間交流,(iii)国際発信の3つの柱を中心に国際事業を展開している。この中でも特に重要なのが3つ目の国際発信であり,その中心となるのが(a)国際シンポジウムの開催(年平均5~6件),(b)海外における日本語研究者と日本語教師のための講習会(年平均6件),(c)国際的な出版社からの研究書の刊行(年平均2冊),(d)優れた日本語研究の英訳・ウェブ公開である。これらの具体的な取り組みを解説する。
「Koan-nee-chee wa から始まる日本語教材」
研究者朝日祥之
概要本発表では,第二次世界大戦中のアメリカで刊行された日本語教科書を取り上げ,その特徴を紹介する。戦時中のアメリカでは,さまざまな日本語教科書が刊行された。そこには日系人たちも多く関わっていた。本発表では,教材をいくつか取り上げ,その日本語のかき表し方とその内容に見られる特徴を説明する。またその書き方が近年刊行されている「日本語本」との比較も行う。
「学習者の日本語の話し方がわかる『BTSJ日本語自然会話コーパス』-日本人の話し方との比較を通して-」
研究者宇佐美まゆみ,張未未,高山春花
概要日本語学習者の学習環境・目的等は多様であるが,「できるだけ自然な日本語が話したい」という願望は,ほとんどの学習者が持っていると言っても過言ではないだろう。その願いを叶えるには,まず,「自然なコミュニケーション」の特徴を明らかにする必要がある。本コーパスは,接触場面と母語場面における初対面の会話,友人同士の会話を中心に,教師と学生の会話,依頼,断り場面の会話など377会話の「自然会話」の音声と文字化資料を提供している。「学習者の日本語の話し方の特徴」を,いかに日本語教育に生かすかを考えるためのヒントがすべて詰まっている。
「学習者の日本語も教材にできる「自然会話リソースバンク(NCRB:Natural Conversation Resource Bank)」-新しい形の共同構築型多機能データベース-」
研究者宇佐美まゆみ,小川都,張未未
概要「自然会話リソースバンク(NCRB)」は,豊富な自然会話データ(映像・音声・文字化資料)を格納し,「研究(データ提供・利用)」と「教材(作成・利用)」の2つの機能を持つ現在開発中の「共同構築型多機能データベース」である。情報環境の発展と研究者,教育者の相互貢献を想定し,これからは,「コーパスの構築」も「教材の開発」も,関連分野の研究者・教育者が協働して構築していくという発想が必須である。NCRBは,その先駆的な試みであり,登録者は,「研究用データの提供・利用」と,「教材作成テンプレート」を用いた「WEB教材」の作成・利用ができるプラットフォームである。
「学習者コーパス「I-JAS」の特徴と日本語教育・研究への活用」
研究者野山広,迫田久美子
概要I-JAS(International corpus of Japanese as a second language)は,国内外の日本語学習者1000名の発話と作文のデータを収録したコーパスである。海外の12言語の母語の日本語学習者と日本国内の留学生,就労者,外国人配偶者らによる約800万語のデータが収められている。日本語母語話者のデータもあり,学習者との比較から言語習得などの研究,日本語指導の実践,さらに他言語の学習者コーパスとの共同研究にも利用でき,様々な分野への活用が期待される。
「言語地図データベースの紹介」
研究者大西拓一郎
概要言語地図は方言の分布を表す地図である。言語地図を見ると,どこでどんな方言が使われているのか,一目でわかる。日本では約440冊,28,000枚もの言語地図が各地で作られてきた。これは世界最大規模である。ただ,これだけあると全体の把握が難しくなる。また,多くの地図集が国立国語研究所研究図書室に所蔵されているが,中にはあまり流布していないために簡単には見られないものや紙の劣化が進んでいる資料もある。言語地図データベースは,これらの検索と閲覧,そして保存を目的として作成されている。
「天草版(キリシタン資料)の画像コンテンツ」
研究者高田智和
概要大英図書館が所蔵する天草版『平家物語』『伊曽保物語』『金句集』は,16世紀の日本を訪れたキリスト教宣教師の日本語学習向けに編集された読本(リーダー)です。中世日本語の発音や口語表現を知ることができるため,日本語史研究で重要視されてきました。国立国語研究所は,大英図書館から天草版画像データの提供を受け,2019年3月からWeb公開を始めました(パブリックドメイン)。また,『伊曽保物語』の説話部分について,原本画像と翻字本文3種(漢字仮名交じり・片仮名・訓令式ローマ字)の対照ビューワによるWeb公開もしています。
「Unicode変体仮名を用いた字形データベース「国語研変体仮名字形データベース」」
研究者間淵洋子
概要江戸時代の版本に現れる変体仮名の字形画像を,現行の平仮名(読み)・字母・Unicodeで層別したデータベースを国語研HPで公開している。変体仮名を階層的に一覧表示できるほか,字形画像を切り出した出典元の資料画像と相互にリンクする機能や,資料画像と翻字本文(くずし字に対する現行文字による書き起こし)とを重ね合わせて表示する機能などを持つ。この動画では本データベースのデモンストレーションを行う。
「『分類語彙表』とは―意味の世界の分類―」
研究者柏野和佳子
概要一般の国語辞典は語が五十音順に並んでいるが,この『分類語彙表』は意味の分類順に並んでいる。それを「シソーラス」と言う。『分類語彙表』(初版1964年,増補改訂2004年)は,現代日本語の最初のシソーラスである。シソーラスは,似た意味の別の言葉を探すのに非常に適している。また,語彙の意味の分布や偏りを見ることができる一覧性がある。この『分類語彙表』のデータは,現在広く公開しているため,ぜひ,多くの方に利用していただきたい。『分類語彙表』の概要と魅力を紹介する。
「「分類語彙表番号-UniDic語彙素番号対応表」の構築―コーパスへの網羅的・体系的な語義情報付与のために―」
研究者近藤明日子
概要日本語の大規模コーパスに体系的な語義情報を網羅的に付与するために,「分類語彙表番号-UniDic語彙素番号対応表」を構築した。この対応表は,シソーラス『分類語彙表』の見出しとコーパスの構築に使用される形態素解析辞書UniDicの見出しとの同語関係を示したものである。この対応表を使うことで,UniDicによって形態素解析されたコーパスの各語に『分類語彙表』の意味範疇を表す分類番号を付与し,コーパスを語義の面から分析することが可能となった。
「『現代日本語書き言葉均衡コーパス』への意味情報(分類語彙表番号と助動詞用法)付与」
研究者加藤祥
概要コーパスを使った調査を行うとき,意味の観点で分析したいことがある。そこで,『現代日本語書き言葉均衡コーパス』の一部データに,人手で分類語彙表番号を付与した。分類語彙表に掲載のない機能語についても,助動詞の用法を付与した。これらのデータを用いることで,意味情報による集計や検索が可能となった。
「分類語彙表に対する単語親密度情報付与」
研究者浅原正幸
概要辞書にはよく利用される語,あまり利用されない語がある。この単語の利用傾向を調べるために,分類語彙表の見出し語に対して「どのくらいよく知っているか」(単語親密度情報)のアンケート調査を行った。調査では「読む」「書く」「聞く」「話す」の4つの観点についても確認し,書き言葉によく利用されている語・話し言葉によく利用されている語の傾向についても分析した。
「日本語の表記から考える書き手の個性」
研究者岩崎拓也
概要今回は句読点の打ち方を取りあげて紹介する。日本語の句読点の打ち方は,書き手の個性が見える重要なポイントである。そこで,まずは句読点のルールを簡単に説明する。つぎに打ち方に迷う読点の例について考えたり,どうすれば句点とカッコの組み合わせがわかりやすくなるか考える。
「記録に基づいてふりかえり活動をしようービデオアノテーションを用いた授業観察とふりかえりー」
研究者山口昌也
概要教育活動における実習では,しばしば活動後にグループでのふりかえりが行われる。今回は,大学の日本語教育関連の授業で,ビデオ収録した日本語学習者向けの授業を学生が観察し,その結果を持ち寄って,グループでのふりかえりを行う試みを紹介する。観察には,ビデオアノテーションシステムFishWatchrを用いる。観察時のコメントは当該のシーンと関連付けられているので,ふりかえり時に実際のシーンを参照しつつ,グループのメンバーと知識共有を図ることができる。
「コーパス検索アプリケーション『中納言』音声配信の紹介
研究者石本祐一
概要日本語のコーパスを検索するためのWebアプリケーション『中納言』では,「日本語話し言葉コーパス」「日本語日常会話コーパス」「昭和話し言葉コーパス」「日本語諸方言コーパス」「多言語母語の日本語学習者横断コーパス」といった音声データを含むコーパスについて音声配信を行っており,検索結果から当該音声を聴取することができる。『中納言』で各コーパスの音声を聴取するための手続きや方法を紹介する。
「『中納言』の概要」
研究者大村舞,石本祐一,岡照晃
概要主に,『中納言』をはじめて使う人のために,検索方法について紹介する。『中納言』では,コーパスを単語や品詞などの形態論情報を用いた検索が可能である。これが『中納言』の大きな特徴である。『中納言』の形態論情報を用いた検索方法について紹介する。また,文字列検索や,位置検索という検索も可能である。あわせて紹介する。
「まとめて検索『KOTONOHA』の紹介」
研究者岡照晃,石本祐一,大村舞
概要『少納言』『中納言』はいずれもコーパスを個別に検索するサービスであり,特に『中納言』には2020年7月現在,9種類の書き言葉や話し言葉,歴史,方言様々なコーパスが格納されている。ただし,『中納言』が提供するサービスは各コーパスを個別に検索するものであり,コーパス同士の検索結果の比較などはユーザ側で1つずつ個別に行う必要があった。まとめて検索『KOTONOHA』は,中納言に格納されているコーパス群を横断的に検索し,1つの画面で結果を確認できる画期的な検索システムである各コーパスの検索結果の統計情報をグラフ表示する機能を主に,各コーパス別の詳細な用例へのリンク機能も備えた包括的な検索サービスとなっている。
「コーパス検索システムの言語単位『短単位』」
研究者岡照晃,石本祐一,大村舞
概要コーパス開発センターの提供しているコーパス検索サービス『中納言』『KOTONOHA』では,「単語」を条件にした検索が特徴である。ただし,英語のように単語間にスペースを置かない日本語において「何を単語とみなすのか?」という問題は古くから議論されており,決着はついていない。そこで『中納言』『KOTONOHA』では,「単語」に代わって「短単位」という言語単位(lexical unit)を設計・規定し,検索に採用している。ここでは,この「短単位」がどういったものであるのかを概説する。
to top - トップに戻る