「通時コーパス」シンポジウム2021 (オンライン)
- 主催
- 国立国語研究所共同研究プロジェクト 「通時コーパスの構築と日本語史研究の新展開」
リーダー : 小木曽 智信 (国立国語研究所 言語変化研究領域 教授) - 共催
- 科研費 基盤研究 (A) 19H00531 「昭和・平成書き言葉コーパスによる近現代日本語の実証的研究」
研究代表者 : 小木曽 智信 (国立国語研究所 言語変化研究領域 教授) - 開催期日
- 2021年3月13日 (土) 13:00~
- 開催場所
- Web開催 (Zoom)
- 事前申し込み
-
受付は終了いたしました。お申し込みありがとうございました。
いただいた個人情報は,個人情報保護ポリシーに則り厳正に取り扱います。
プログラム
13:00~14:30 口頭発表Ⅰ (Zoom)
- 「『日本語歴史コーパス』ver.2021.3 通時コーパス構築進捗報告」
小木曽 智信 (国立国語研究所)
『日本語歴史コーパス』の2021年3月の公開バージョンでは,新たに「明治・大正編Ⅳ近代小説」が公開される。また「奈良時代編Ⅲ祝詞」として延喜式祝詞が,「江戸時代編Ⅳ随筆・紀行」の一部として芭蕉の紀行文が公開されるほか,「明治・大正編Ⅲ明治初期口語資料」に『春秋雑誌会話篇』が追加される。本発表では,このようなコーパスの最新の構築状況や来年度の計画について報告するほか,本プロジェクト終了後の構想も含め,今後の通時コーパス構築の方向性について述べる。
- 「中古語複合動詞の客体敬語の形」
呉 寧真 (国立国語研究所)
中古和文の複合動詞の敬語形は,主体敬語形の場合,敬語独立動詞を主に用いる動詞と,「たまふ」を主に用いる動詞に分かれ,敬語独立動詞が2種類以上ある動詞は敬語独立動詞を使う傾向があり,そうでない動詞は「たまふ」を使う傾向がある。それでは,客体敬語の場合はどのような状況なのだろうか。本発表では『日本語歴史コーパス』を用いて複合動詞の客体敬語の実態を調査し,主体敬語とは異なり,敬語独立動詞を有する動詞は敬語独立動詞を使う傾向があり,そうでない動詞は敬語補助動詞が後接する形を用いていることを示す。
- 「「XモYニ」における助詞モの機能」
小池 俊希 (東京大学大学院生)
本発表では,「枝もたわわに」など現代語にも慣用句として残存する,「XモYニ」という構文に着目する。この構文は,上代においてはある程度の生産性が認められ,程度を表す従属句のひとつとしてはたらいていた。この構文の助詞モに対する先行研究の解釈は,副助詞 (とりたて詞) 的な解釈と,係助詞的な解釈とに大きく分かれる。前者の解釈は,「枝もたわむばかり」 (源氏・若菜下) など,「主語+モ+……」という形の従属句を背景に成立するものと思われるが,「XモYニ」を除くと,そのような従属句のほとんどは中古以降に確認される。そこで本発表では,上代語を対象として,「マデ」や「連用形 (+テ) 」の副詞的用法などとの対照をおこない,「XモYニ」における助詞モの機能について明らかにする。
14:30~16:00 ポスター発表 (Zoomブレイクアウトルーム)
- 「『日本語歴史コーパス 奈良時代編Ⅲ祝詞』の形態論情報・原文情報整備」
間淵 洋子 (国立国語研究所) - 「『日本語歴史コーパス 鎌倉時代編Ⅲ軍記』の進捗と展望」
片山 久留美,呉 寧真 (国立国語研究所) - 「室町時代古辞書広本『節用集』語および語注記内容の周圏 ―あざる【回島・求食】―」
萩原 義雄 (駒澤大学) - 「源氏物語の自由間接話法にみる言語的ユニバーサリティ」
竹内 綾乃 (国立国語研究所) - 「「コンタミネーション」をめぐって」
大西 拓一郎 (国立国語研究所) - 「語種と意味分野から見る近現代日本語形容詞の変遷」
星川 睦 (明治大学大学院生) - 「『日本語歴史コーパス 江戸時代編Ⅳ随筆・紀行』Ver.0.4 (芭蕉の紀行文) の公開と活用に向けて」
松崎 安子 (国立国語研究所) - 「明治・大正期の文語文の文体分析」
近藤 明日子 (国立国語研究所) - 「古文疑似データの生成による古文現代語機械翻訳の改良」
吉田 あいり (早稲田大学大学院生) - 「日本語と韓国語における外来語の受容による語彙の変化 ―「カード」の意味・用法の分析を通して―」
黄 秀智 (明治大学大学院生) - 「『日本語歴史コーパス 明治・大正編Ⅳ近代小説』の構築と公開」
髙橋 雄太 (国立国語研究所)
16:00~17:30 口頭発表Ⅱ (Zoom)
- 「利用者からみる通時コーパス資料 ―離縁・離婚の他動詞用法を例に」
永澤 済 (名古屋大学)
「裁判所がAとBとを離婚する」「男が女を離縁 (離婚) する」等,発表者の「離縁/離婚」の他動詞用法についての調査を例に,現行の通時コーパスからどのような用例を拾え,どのような用例を拾えないかをみる。そこから,現時点でコーパス化されていない資料の活用可能性について考えてみたい。
- 「Bi-LSTM を用いた中古日本語の文境界推定」
鈴木 理紗 (東京大学大学院生),川上 玲 (東京工業大学 / デンソーアイティーラボラトリ),カラーヌワット タリン (ROIS-DS人文学オープンデータ共同利用センター / 国立情報学研究所),北本 朝展 (ROIS-DS人文学オープンデータ共同利用センター / 国立情報学研究所),中澤 敏明 (東京大学),苗村 健 (東京大学)
可読性の低い古文書を研究に用いる際,通常まず翻刻を行うが,そのための人手が不足しており,自動化が期待される。本稿では,翻刻の中でもその他の作業に先立って必要と考えられる文境界推定を自動で行う手法を提案した。その後の書き言葉の基礎となる中古日本語の古典籍データ (『日本語歴史コーパス』平安時代編) を対象に,深層学習の一種である Bi-LSTM を用い,入力には形態素を利用して実験を行った。精度の高い形態素解析には句点が事前に必要であることも考えられるが,本稿は自動形態素解析が人間の性能と同等であった場合を想定し,その上での文境界推定の性能を計測することに重点を置く。PR (Precision-Recall) 曲線の AUC (Area Under Curve) で0.894を達成し,専門家による定性評価で高評価を得た。
- 「昭和20年代前期『文藝春秋』の言語記事から ―「雑誌記事データベース」活用の一例として」
新野 直哉 (国立国語研究所)
「語誌データベース」の一部である「言語記事データベース」のうち「雑誌記事データベース」を活用した研究の一例として,昭和20年代前期の『文藝春秋』 (25年の新聞記事で河盛好蔵は「現代日本人の今日 (明日ではない) の興味がどこにあるかをこの雑誌ほど的確につかんでいるものはない」と評している) の言語記事から,英語やその学習・習得法に関する記事,当用漢字や新仮名遣いなど国語政策・国語問題に関する記事,当時の新語・流行語・業界用語に関する記事,言葉の「誤用」を指摘する記事など,当時の言語状況を反映するような特に興味深い記事について見ていく。