国立国語研究所

国立国語研究所オープンハウス2022

トップページ > 研究の紹介

発表

研究の紹介

実証的な理論・対照言語学の推進
タイトル実証的な理論・対照言語学の推進
研究者浅原正幸、五十嵐陽介、窪田悠介、プラシャント・パルデシ、松本曜
概要理論・対照グループの基幹型共同研究プロジェクト「実証的な理論・対照言語学の推進」について紹介する。本プロジェクトでは、科学的根拠に基づく実証的な理論的研究を進め、言語学のオープンサイエンス化を目標として、データの整備・公開を進める。データの整備・公開にあたってはサブプロジェクトメンバーで相互に協力し、言語学の多様な理論の多角的な検証体制を確立する。さらには理論・対照言語学におけるデータの共用手法について検討を進める。また、理論言語学・対照言語学のオープンサイエンス化を推進する取組として、研究資料のオープンアクセス化に必要な施策を講じ、全所的な共同研究発表会の中で言語学分野におけるオープンサイエンスの普及に努める。
アノテーションデータを用いた実証的計算心理言語学
タイトルアノテーションデータを用いた実証的計算心理言語学
研究者浅原正幸
概要理論・対照グループの基幹型共同研究プロジェクト「実証的な理論・対照言語学の推進」のサブプロジェクトとして「アノテーションデータを用いた実証的計算心理言語学」を進めている。本プロジェクトでは、統語班・意味班・認知班に分かれて以下の研究を進めている。統語班では Universal Dependencies に基づく言語資源整備および情報交換を行う。意味班では『分類語彙表』に基づく言語資源整備を行う。認知班では共有可能な言語認知実験環境の整備を行う。ポスターではそれぞれの班の研究計画について示す。
現代日本の言語生活の実態を捉えるための社会言語学的研究
タイトル現代日本の言語生活の実態を捉えるための社会言語学的研究
研究者朝日祥之
概要本発表では、共同研究プロジェクト「多言語・多文化社会における言語問題に関する研究」を紹介することを目的とする。現在の言語生活における言語使用実態を手がかりに日本社会で生じている言語問題を捉える。その試みとして、昨年度から実施している準備研究 (多言語社会における言語選択、言語景観、手話言語、日本語における先端的言語変化) の予備的考察を行いつつ、今後の展望を示す。
音響分析に適した高音質の方言自発音声コーパスの構築
タイトル音響分析に適した高音質の方言自発音声コーパスの構築
研究者五十嵐陽介
概要日本語の地域変種 (方言) の音声研究を発展させるためには、方言の自発音声を格納したコーパスが有用である。従来の方言コーパスに格納された音声は必ずしも音響分析に適したものではなかった。本発表では、地域変種話者である50名の大学生による自発音声 (22時間) を格納した高音質の音声データベース『広島大学日本語電話会話コーパス』の概要を紹介する。
日本語学習者の作文の縦断コーパス研究
タイトル日本語学習者の作文の縦断コーパス研究
研究者石黒圭、井伊菜穂子、本多由美子
概要日本語をゼロから学び始めた学習者は、どのような過程を経て作文の執筆能力を上達させていくのだろうか。この問いを明らかにするため、本研究では、中国・台湾・韓国・ベトナム・タイの複数の大学と連携し、約600名 (開始時) の日本語学習者を対象に、1学年から4学年までの4年間にわたる縦断的な作文調査を行っている。発表では、これまでに収集したデータも踏まえながら、調査の概要を紹介し、コーパスとして公開予定の作文や作文執筆にかかわる幅広いデータの全体像を紹介する。
日本語学習者の辞書使用の実態調査
タイトル日本語学習者の辞書使用の実態調査
研究者石黒圭、吉甜、佐野彩子
概要昨今、紙の辞書を使う日本語学習者は少ない。スマホやパソコンを用いて、インターネット上の辞書や検索エンジン、アプリケーションを使って言葉を調べるのが一般的である。しかし、学習者がこれらのツールによって、いつ、どこで、何を、どのように調べ、その結果、必要な情報にたどり着けているかどうかの実態は明らかではない。この研究では、海外の大学の調査協力を得て、学習者が実際に日本語表現を調べる際の画面を録画してもらい、学習者の行動を観察することによって、辞書ツール使用の実態を解明することを目指している。
北京日本語学習者縦断コーパス (B-JAS) の公開
タイトル北京日本語学習者縦断コーパス (B-JAS) の公開
研究者石黒圭、須賀和香子、鈴木靖代
概要北京日本語学習者縦断コーパス (B-JAS) は、日本語がほぼゼロの段階で日本語学科に入学し、4年間日本語を集中的に学んで卒業した北京師範大学の学部学生17名を対象に、8回のインタビュー調査、および11回の作文調査を継続的に行い収集したものである。12言語17ヶ国20地域を対象にした学習者横断コーパスである I-JAS に準拠して設計し、第二言語の習得過程解明に必要な縦横のデータベースの整備を目指して構築している。現在、2022年度中にプロジェクトのサイトで公開を行うことを目指し、準備を進めている。本発表ではその準備状況を報告する。
みんなで談話整備プロジェクト ―文化庁「各地方言収集緊急調査」資料の整備と活用―
タイトルみんなで談話整備プロジェクト ―文化庁「各地方言収集緊急調査」資料の整備と活用―
研究者井上文子
概要『全国方言談話データベース 日本のふるさとことば集成』全20巻 (国書刊行会)、「日本語諸方言コーパス」(Corpus of Japanese Dialects : COJADS) の元データである、文化庁「各地方言収集緊急調査」(1977~1985年) の方言談話のデータ整備作業を共同でおこなっていくプロジェクトを立ち上げました。「各地方言収集緊急調査」資料の全貌を説明し、プロジェクトの概要を紹介します。
定住外国人の語りからみた日本語表記方法の提案
タイトル定住外国人の語りからみた日本語表記方法の提案
研究者岩崎拓也
概要「やさしい日本語」で発信するさいに用いられる、ルビや句読点、分かち書きといった表記は、書き手側からのみの主観的な配慮によって考えられて使用されているのが現状である。そこで、現在は、身の回りにある日本語とその表記についてどのように定住外国人が考えているのか、調査を行っている。今回は、中国語を母語とする2名の定住外国人のインタビューをつうじて、彼 (女) らが常日頃見たり読んだりしている日本語や、学習環境の現状、日本語表記についてどのように考えているのかという意識についてまとめた結果を報告する。
『BTSJ 日本語1000人自然会話コーパス』と『自然会話リソースバンク (NCRB)』
タイトル『BTSJ 日本語1000人自然会話コーパス』と『自然会話リソースバンク (NCRB)』
研究者宇佐美まゆみ
概要『BTSJ 日本語1000人自然会話コーパス』とは、延べ1000人分の「自然会話」を収録した世界最大規模の「自然会話コーパス」である。「音声データ」と、『基本的な文字化の原則 (BTSJ) 』によって、割り込み・沈黙等の語用論的分析に必須の情報を付した「文字化資料」を無料で公開している。最終版は、『自然会話リソースバンク (NCRB) 』に搭載したので、NCRB 上で「動画」も閲覧でき、『自然会話を素材とする教材』を作ることもできる。ここでは、『BTSJ コーパス』と『NCRB』の連携とそれらの活用法を紹介する。
同音衝突の基本といろいろ
タイトル同音衝突の基本といろいろ
研究者大西拓一郎
概要言語地理学において同音衝突とは、同音異義語が地理的相補分布を示すこととされる。同音衝突とされる現象を集めて整理すると、①同音異義語が分布領域を分ける基本的なもののほか、②一方が他方に入り込んで同音異義語が発生してしまっているケースや、③それにより語彙崩壊が発生したケース、④同音異義語をベースに新たな同音衝突が生み出されるケースから⑤もとの同音語が消滅することで同音異義語が更新されるケースなど、さまざまな事例が見いだされる。いずれにあっても地理的相補分布は保証されており、同音衝突であることを示す。
いろいろな古文の自動品詞分解 ―歴史的日本語資料の形態素解析と「Web 茶まめ」―
タイトルいろいろな古文の自動品詞分解 ―歴史的日本語資料の形態素解析と「Web 茶まめ」―
研究者小木曽智信
概要日本語の歴史を精密に研究するために、大量の古文のテキストを解析してどこにどんな単語が使われているかデータベース化する (=単語情報付きのコーパスを作る) 必要がある。この品詞分解のような処理は、形態素解析という技術によってコンピューターで自動で行うことができるが、古文には対応した辞書がないため解析ができなかった。そこで、いろいろな古文を解析するための電子辞書 (古文用の UniDic) を作成して解析を可能にした。これらの辞書は「Web 茶まめ」というオンラインのツールで誰でも利用できるよう公開している。( https://chamame.ninjal.ac.jp/ )
用例分析に基づく国語辞典情報の見直し (その4)
タイトル用例分析に基づく国語辞典情報の見直し (その4)
研究者柏野和佳子
概要今回は競技の言葉に着目して取り上げる。新聞記事や、ネット記事、ニュース等において、ある競技で用いられる語が、その競技以外で比喩的に用いられる例を多くみる。たとえば、「そろい踏み」は、相撲で横綱が複数の力士がそろって四股を踏むこという語であり、「続投」は、野球で投手が交代せずに投げ続けることを言う語である。しかし、競技以外にも「野党党首がそろい踏み」や、「総裁が続投」のように用いられる。このような競技の語に着目した用例分析について報告する。
共同的課題の遂行と言語表現の関係
タイトル共同的課題の遂行と言語表現の関係
研究者川端良子
概要複数の人が共同して一つの目標の達成を目指して活動する際、活動を円滑に遂行するために行われる言語活動の全体は、「課題指向対話」と呼ばれる。本研究は、課題指向対話の1つである『日本語地図課題対話コーパス』を用いて、人々がどのような言語表現を用いて地図課題を遂行しているか、言語活動と課題の遂行がどのように関係しているかについて分析を行った。その結果、いくつかの課題の遂行パターンと指示表現の間に関連性があることが明らかとなった。
比較文の計算意味論の構築 (試論)
タイトル比較文の計算意味論の構築 (試論)
研究者窪田悠介
概要機械学習技術の進展などにより統語解析器の精度が向上しているが、自然言語処理分野で開発されている統語解析器では、言語学的に複雑な構文を適切に扱うことができない。本研究では、「警察官の初任給は他の公務員よりも多い」などの比較文の意味を適切に解析できる統語解析器を作るために何が必要であるかに関して、言語学的な観点と自然言語処理の観点を付き合わせることで問題の整理を行う。
日常会話コーパスを使ってみよう
タイトル日常会話コーパスを使ってみよう
研究者小磯花絵
概要国立国語研究所では、多様な場面における多様な話者による日常会話200時間を対象とする『日本語日常会話コーパス』を2022年に公開しました。このコーパスを用いることで、私たちが場面や相手によってどのようにことばを使いわけているか、また話者の年齢などによりことばの使い方がどのように変化するかを、詳しく調べることができます。
戦前期の布哇教育会編纂『日本語読本』
タイトル戦前期の布哇教育会編纂『日本語読本』
研究者高田智和
概要1868年の移民開始以降、ハワイでは日系人社会が形成されてきた。2世、3世に対する日本語教育のために日本人学校が開設され、日本語教科書 (リーダー) も編纂された。1915年設立の布哇教育会は、1917年 (全6巻)、1929年 (全6巻)、1936年 (全12巻) と、戦前期に3種類の日本語教科書を編纂した。これらの教科書は、第二言語、あるいは継承語としての日本語を知る資料であるため、将来のコーパス作成も視野に入れ、今般全文テキストデータを作成し、公開した。全文テキストデータをもとに、文字量などについて基礎計量を行った。
ハとその他の主題助詞
タイトルハとその他の主題助詞
研究者中川奈津子
概要日本語にはハの他にも、ダケド、ɸ (無助詞) のような主題助詞があるが、どのように使い分けられているのだろうか?本発表では「今その話が出ているかどうか」という観点から、「史上初めて話に出てきたもの」「今回話に出てきたが以前話したことがあるもの」「関連物が話に出ているもの」「今その話をしているもの」の4種類に分け、ハ・ダケド・ɸ (無助詞) の使い分けの範囲を例を示しながら概観する。
昭和20年代前半期の言語生活・言語意識 ―『文藝春秋』言語記事から―
タイトル昭和20年代前半期の言語生活・言語意識 ―『文藝春秋』言語記事から―
研究者新野直哉
概要昭和20年代前半期の雑誌『文藝春秋』の言語記事 (言語をめぐる状況の報告・解説を行ったり、言語についての何らかの意識・意見・感情等を伝えたりしている記事) のうち、当用漢字や新仮名遣いなど国語政策・国語問題に関する記事、新語・流行語・業界用語を取り上げた記事、言葉の「誤用」を指摘する記事など、終戦直後の混乱期である当時の言語生活・言語意識がうかがえるような特に興味深い記事について見ていく。近代の新聞・雑誌の言語記事を収める「言語記事データベース」の活用例である。
定住外国人の日本語使用と談話に関する縦断的研究 ~学習者の高齢化、言語摩滅の過程に注目しつつ~
タイトル定住外国人の日本語使用と談話に関する縦断的研究 ~学習者の高齢化、言語摩滅の過程に注目しつつ~
研究者野山広
概要本中期計画の初年度にあたり、今回の発表では、OPI (Oral Proficiency Interview) の枠組みを活用した縦断調査 (形成的フィールドワーク) の結果の中で、特に、韓国出身の学習者 A (50代で来日し、現在70代の国際結婚の配偶者) の、コロナ禍を含めた最近の状況に焦点を当てる。この数年間の彼女の状況を踏まえると、日本語の習得、維持の状況から、摩滅の過程へと徐々に変容し始めているようである。ポスターでは、日本語使用や談話 (日本語会話) の分析結果や Web 上に公開した会話データベースを基にした発表や、今後の研究計画等に関する報告を行う。
文字社会日本の「よみかき」再考
タイトル文字社会日本の「よみかき」再考
研究者福永由佳
概要私たちの日常生活には、メモを書いたり、新聞を読んだり、メールを書いたり、といったように文字を使う活動が溢れている。そして、日本人の識字率は、諸外国に比べて高いという言説が広く信じられているため、日本には「よみかき」に関する問題はないと思う人も少なくないだろう。日本人のよみかき能力についての調査は、戦後2回実施されたが、それから数十年経過し社会は大きく変化した。本発表では、日本の「よみかき」にあらためて光をあて、社会の課題として考えてみたい。
学習者用「日本語機能語バンク」の構築
タイトル学習者用「日本語機能語バンク」の構築
研究者プラシャント・パルデシ、大久保弥
概要日本語の自他交替・格標示は、日本語学習の重要項目である。自他動詞は語彙的な対が豊富にあり、格助詞による項標示や、時間・場所等の付加詞標示は多様である。また、定型的な文型 (機能表現) も、その意味や適切な使用文脈の理解は容易でない (例 : 「〜なければならない」「~だけあって」等)。これらの学習には体系的で良質な教材が求められるため、学習環境が整っていない海外の教育現場では、大きな困難を抱えている。この課題を解決すべく、本プロジェクトでは、自他動詞、格助詞、文型の学習に役立つオンライン辞書「日本語機能語バンク」を開発し、国内外の日本語教育・研究への貢献を目指している。本発表ではプロジェクトの構想と進捗を報告する。
どうすれば語彙学習が楽になるか
タイトルどうすれば語彙学習が楽になるか
研究者松下達彦
概要母語話者の大学生は、おおむね4万以上の語の基本的な意味がわかります。留学生などは、そんなにたくさんの単語を知らなくても大学の授業についていけますが、それでも大学で勉強や研究をするには、少なく見ても7千程度の語がわかることが必要です。それだけたくさんの語を覚えるのは大変なことです。仕事や生活に必要な語はまた異なります。どうすれば語彙学習を楽にすることができるのか、そのためにどのような研究が必要なのか、テキストカバー率、語彙頻度プロファイル、語彙テスト結果の利用法などから説明します。
使役移動表現の類型論
タイトル使役移動表現の類型論
研究者松本曜、眞野美穂 (大阪大学)
概要実証的な動詞の類型論的研究の一例として、諸言語における使役移動の表現に関する研究を紹介する。日本語を含む7つの言語の話者が、様々な使役移動事象 (手で動かす、蹴る、運ぶ、呼ぶ) をどのように表現するかを、プロジェクト共同研究員が行ったビデオ実験の結果から明らかにする。表現の性質を、文の複雑性、複数動詞構文の使用、使役経路動詞の使用などの観点から分析した結果、用いられる表現は使役移動事象の種類と言語によって異なることが明らかになった。その結果を捉える意味地図を提案する。
日本の消滅危機言語・方言のためのデジタルアーカイブ開発
タイトル日本の消滅危機言語・方言のためのデジタルアーカイブ開発
研究者宮川創
概要現在、国語研では、多数の日本の消滅危機言語・方言のデジタルアーカイブの開発が行なわれている。本発表では、その中で、TEI (Text Encoding Initiative)、IIIF (International Image Interoperability Framework)、DC (Dublin Core)、UD (Universal Dependencies) といった現在 Digital Humanities で世界標準となっている技術を活用した統合ポータル NINDA、ウェブ版沖縄語辞典、およびベッテルハイム琉訳聖書デジタルエディションについて述べる。そして、これらの言語資源を用いた、統語・形態素情報タグ付きコーパスや概念辞書 wordnet 等への応用の展望について述べる。
多段階の振り返りを考慮した教育活動データの共有
タイトル多段階の振り返りを考慮した教育活動データの共有
研究者山口昌也
概要プレゼンテーション練習などの協同型の教育活動では、個人での観察・振り返りの後、小グループやクラス全体で振り返りを行うなど、多段階の振り返りが行われることがある。これまで、発表者は、練習などの実技に対するビデオアノテーションにより学習者の観察と振り返りを支援するシステム FishWatchr を開発してきた。本発表では、複数の FishWatchr がネットワークを介して、ビデオやアノテーション結果を共有し、複数の段階の振り返りで利用する方法を示す。
「現代日本語書き言葉均衡コーパス」の漢字と表記
タイトル「現代日本語書き言葉均衡コーパス」の漢字と表記
研究者山崎誠
概要「現代日本語書き言葉均衡コーパス」に現れる漢字と表記の頻度調査の結果を報告する。漢字は全体では、「人、一、日、年、大、分、出、行、中、生」の順であったが、レジスターによる違いが見られた。表記では、1語あたりの表記数 (1語彙素 ID あたりの書字形の異なり) は全体で平均約1.53であったが、名詞 (1.41)、形状詞 (2.01)、助動詞 (2.07)、副詞 (2.31)、動詞 (2.90)、接続詞 (3.31)、助詞 (3.36)、形容詞 (3.86)、感動詞 (4.07) のように品詞による違いが見られた。また、語の使用頻度が大きくなるにつれて表記数が増える傾向が確認された。
クラウドファンディングを利用して琉球諸語の絵本を4冊出版しました
タイトルクラウドファンディングを利用して琉球諸語の絵本を4冊出版しました
研究者山田真寛
概要2020年のはじめに304名から400万円以上の支援を受けてクラウドファンディングプロジェクト『「いま何もしなければ」なくなってしまう琉球諸語の絵本を出版』が成立し、2022年に竹富島、多良間島、沖永良部島、与那国島の昔話を元にした絵本をすべて出版することができました。この発表ではプロジェクト挑戦期間中のレポートと、出版後の波及効果についてお話します。
「言語変化のデータサイエンス基礎」大学院オンデマンド授業体験
タイトル「言語変化のデータサイエンス基礎」大学院オンデマンド授業体験
研究者横山詔一
概要言語変化研究に欠かせないデータ解析手法であるロジスティック回帰分析の基礎を解説します。オンデマンド形式の授業で、カナダのトロント大学が公開しているカナダ英語の変化に関するデータベースの利用方法、Excel による回帰分析の具体的操作、Excel による予測確率の算出方法などを動画 (YouTube で公開中、東京大学大学院の授業で使用したもの) で具体的に説明します。
to top - トップに戻る