「通時コーパス」シンポジウム2019

「通時コーパス」シンポジウム2019
[ PDF | 1,884KB ]
主催
国立国語研究所共同研究プロジェクト 「通時コーパスの構築と日本語史研究の新展開」
リーダー : 小木曽 智信 (国立国語研究所 言語変化研究領域 教授)
共催
国立国語研究所共同研究プロジェクト 「大規模日常会話コーパスに基づく話し言葉の多角的研究」
リーダー : 小磯 花絵 (国立国語研究所 音声言語研究領域 准教授)
科研費 基盤研究 (A) 「日本語歴史コーパスの多層的拡張による精密化とその活用」
研究代表者 : 小木曽 智信
開催期日
平成31年3月9日 (土) 10:00~17:00
開催場所
国立国語研究所 講堂 (東京都立川市緑町10-2)
交通案内

一般参加可・参加無料・事前登録不要

プログラム

10:00~11:40 口頭発表

  • 「『日本語歴史コーパス』ver.2019.3 通時コーパス構築進捗報告」
    小木曽 智信 (国立国語研究所)

    『日本語歴史コーパス』の2019年3月の公開バージョンでは,新たに「和歌集編」として八代集,「江戸時代編Ⅱ人情本」として8作品,「明治・大正編Ⅲ明治初期口語資料」として10作品が「中納言」上で公開される。さらに「明治・大正編Ⅰ雑誌」に『東洋学芸雑誌』が追加されるほか,「江戸時代編Ⅰ洒落本」のアップデートが行われる。「人情本」「洒落本」では本文とフリガナに別個に見出し語情報をつけるなど形態論情報を重層的に付与し,これを利用可能にするために検索インターフェイスの改良も行った。このようなコーパスの最新の構築状況について報告する。

  • 「古代語の「形容詞+モ」に関わる構文とその機能」
    鴻野 知暁 (東京大学)

    古代日本語で,形容詞に助詞のモが連接した形式がどのような構文と結びつくかを整理する。その中で,「形容詞終止形+モ」,「形容詞連用形+モ…カ/カナ」といった詠嘆を表わす構文に特に着目する。これらはモの合説性からは説明しがたいものだが,時代とともにどのように使用が変化していくかを報告する。「形容詞連用形+モ…カ/カナ」において,モに上接する部分は「逆述語」 (川端善明氏の用語) として捉えることのできる場合があり,「注釈―被注釈」という構文型の一つとして考えることができる。この文構造のあり方について,係り結びと比較することも行う。

  • 「中古散文における「連体形+ゾ」文と連体ナリ文の用法上の差異について」
    勝又 隆 (福岡教育大学)

    中古日本語において,現代語のノダ文と構造・用法の点で類似した構文として,連体ナリ文が知られている。しかし,連体ナリ文は「知識表明文」 (「提示」のノダ) の用法は持つが,「判断実践文」 (「把握」のノダ) の用法は無いとされる (福田嘉一郎 (1998) )。一方,「連体形+ゾ」文は「提示」の用法に加え,「われゆゑにかかる目を見るぞと思ふに (「自分のせいで姫君がこんな目をみるのだ」と思うと) 」 (落窪物語) のように,「把握」のノダの用法が散見される。こうした差異は,従来ほとんど注目されておらず,未整理の状態である。そこで本発表では,中古散文における「連体形+ゾ」文の用法を整理し,連体ナリ文との相違点を明らかにする。

  • 「語誌データベースの構築と設計上の問題点」
    山崎 誠 (国立国語研究所),桂 祐成 (東京電機大学)

    本発表では,日本語史研究に有用であるが,コーパス化に向かない資料を集めた「語誌データベース」について紹介する。このデータベースには,古辞書,言語地図,言語記事 (言葉について書かれた新聞・雑誌の記事) などが収録されている。特徴としては,検索結果の多くがグラフや画像で確認できることである。その意味では,ビジュアルに特化したワードプロファイラーの一種と言うこともできる。2019年3月現在の収録コンテンツは,日本語歴史コーパスからの統計情報,『二十巻本和名類聚抄』 (古活字版),『言語地図画像データベース』,大正期の読売新聞および文藝春秋からの言語記事である。今後,それぞれの収録量を増やすとともに,文献情報も見られるようにする予定である。語誌データベースを『日本語歴史コーパス』と併用することでより総合的な日本語史研究が展開できるだろう。

11:40~12:40 ポスター発表

  • 「複合動詞「~ヌク」の歴史的変遷 ―〈完遂〉用法獲得の過程に着目して―」
    池田 來未 (お茶の水女子大学大学院生)
  • 「つなげる,くらべる方言分布図 ―方言地図データベースの活用―」
    大西 拓一郞 (国立国語研究所)
  • 「近代における字音接頭辞「非・不・未・無」 ―『日本語歴史コーパス 明治・大正編I雑誌』を資料として―」
    小椋 秀樹 (立命館大学)
  • 「『日本語歴史コーパス 明治・大正編Ⅲ明治初期口語資料』の構築」
    近藤 明日子 (国立国語研究所 / 明治大学)
  • 「『日本語歴史コーパス 上代編Ⅱ宣命』の構築と公開」
    呉 寧真 (国立国語研究所 / 國學院大學大学院生),池田 幸恵 (中央大学),須永 哲矢 (昭和女子大学)
  • 「通時コーパスを利用したプロジェクト学習の実践例 ―敬語・古典常識の抽出と教材作成―」
    須永 哲矢 (昭和女子大学),橋本 莉奈,金澤 稀愛,江成 麻子,榎谷 あやか,榎本 早紀,藤井 千里,村田 柚衣,冨田 美晴,中村 日向子 (昭和女子大学学生)
  • 「天草版平家物語・伊曽保物語・金句集の原本画像公開」
    高田 智和,片山 久留美 (国立国語研究所),桂 祐成 (東京電機大学),大塚 靖代,ヘイミッシュ・トッド (大英図書館)
  • 「近代小説のコーパス化とその課題」
    髙橋 雄太 (国立国語研究所 / 明治大学大学院生),服部 紀子 (国立国語研究所)
  • 「『東洋学芸雑誌』コーパスの構築Ⅱ ―『日本語歴史コーパス 明治・大正編Ⅰ雑誌』での公開―」
    南雲 千香子 (国立国語研究所),近藤 明日子 (国立国語研究所 / 明治大学)
  • 「1945年以降の韓国新聞コーパス作成 ―日韓外来語史の対照研究のために―」
    黄 秀智 (明治大学大学院生)
  • 「『日本語歴史コーパス 和歌集編 八代集』の公開に向けて」
    松崎 安子 (国立国語研究所)
  • 「TEIによる近世版本の構造化」
    間淵 洋子,高田 智和 (国立国語研究所)
  • 「『日本語歴史コーパス 江戸時代編Ⅱ人情本』の公開に向けて」
    村山 実和子 (国立国語研究所)
  • 「訓点資料の形態素解析用本文作成とその意義 ―「西大寺本金光明最勝王経」平安初期点を用いて―」
    柳原 恵津子 (国立国語研究所)
  • 「語誌データベースの試験公開」
    山崎 誠,相澤 正夫,大西 拓一郎,柏野 和佳子,高田 智和,新野 直哉,間淵 洋子 (国立国語研究所),桂 祐成 (東京電機大学)
  • 「日本語歴史コーパス (CHJ) と平安時代漢字字書総合データベース (HDIC) との連携 ―観智院本類聚名義抄を例に―」
    劉 冠偉 (北海道大学大学院生),池田 証寿 (北海道大学)
  • ほか追加予定あり

    12:40~14:00 休憩

    14:00~16:30 テーマセッション 『歴史的音源資料と日本語研究』

    コーディネーター
    丸山 岳彦 (専修大学 / 国立国語研究所)
    • 14:05~14:40
      発表 (1) 「録音資料のコーパス化とその困難点」
      金澤 裕之 (目白大学)

      明治・大正・昭和戦前期に作製・販売された蓄音機 (SP) レコードには,その当時流行した各種芸能などの録音が多数残されているが,それらの中で特に,東西の落語や演説・講演のレコードは,当時 (一般) の話しことばの状況を如実に描き出している資料として,日本語史研究の中で重要な位置を占めている。これらの資料を学界で広く利用するためには,そのコーパス化が不可欠であり,一部にはそうした活動の実態も見られるが,それらの具体例を紹介するとともに,コーパス化に当たっての背景や困難点などについて,実際の音声 (の一部) を紹介しながら,改めて検討してみたいと思う。

    • 14:40~15:15
      発表 (2) 「SP盤演説レコードがひらく音声変異研究の可能性」
      相澤 正夫 (国立国語研究所)

      SP盤演説レコードは,大正~昭和戦前期の政治家・軍人・実業家・文化人等の演説・講演を収録した歴史的音源資料である。「20世紀前半の公的な硬い言い回しの口語資料」と位置づけられるが,話者の生誕年 (最も古いのは大隈重信の1838年) と多様な出身地に注目すると,音声変異研究に新たな活用の道が開けてくる。本発表では,ガ行鼻音を事例として取り上げ,音源そのものの聞き取りによって得られたデータから,収録時より数十年は早い19世紀後半の各地における保持状況の推定を試みる。

    • 15:15~15:50
      発表 (3) 「日本語史研究資料としての在欧録音資料群」
      清水 康行 (日本女子大学)

      1890年代末以降,様々な言語を学術目的のために収録する録音アーカイブが,欧州各地で設立され,パリ,ウィーン,ベルリンでは,それぞれ,日本人による吹込みが行なわれている。これらは,日本の言語史・文化史上,極めて貴重な資料群となる。特に,1900年7-8月のパリでの吹込みは,現存最古の日本語録音であり,内容も朗読・会話などと豊富で,かつ,音声がインターネット公開されており,最も価値の高い在外録音資料群といえる。また,パリには,やや時代は下るが,上田万年などの声が残されてもいる。本発表では,これらの資料群を紹介すると共に,そこに含まれる日本語音声内容の特徴を,幾つか指摘する。

    16:30~17:00 全体討論