研究業績 / Achievements

2025年度

Papers

  • Hiroyuki Deguchi, Go Kamoda, Yusuke Matsushita, Chihiro Taguchi, Kohei Suenaga, Masaki Waga, Sho Yokoi (2025), “A Soft and Fast Pattern Matcher for Billion-Scale Corpus Search”, The Thirteenth International Conference on Learning Representations (ICLR 2025), (To Appear).

  • Makoto Shing, Kou Misaki, Han Bao, Sho Yokoi, Takuya Akiba (2025), “TAID: Temporally Adaptive Interpolated Distillation for Efficient Knowledge Transfer in Language Models”, The Thirteenth International Conference on Learning Representations (ICLR 2025), (To Appear).

  • Kanako Komiya, Soma Asada, Masayuki Asahara (2025), “Automatic Tagging of Word Senses for a Large-Scale Historical Japanese Corpus”, Digital Humanities Conference 2025 (DH 2025), (To Appear).

  • 浅原 正幸 (2025), 「Bayesian Linear Mixed Model に基づく漢字親密度推定の試みーー言語資源としての統計モデルの検討」, 『日本語・日本学研究』, 東京外国語大学国際日本研究センター.

2024年度

Books

  • 呉 軍 著・持橋 大地 監訳・井上 朋也 訳 (2024), 「数学の美」, 東京化学同人.
    【URL】

Papers

  • Hiroaki Ozaki, Kanako Komiya, Masayuki Asahara, Toshinobu Ogiso (2024), “Long Unit Word Tokenization and Bunsetsu Segmentation of Historical Japanese”, Proceedings of the 1st Workshop on Machine Learning for Ancient Languages (ML4AL 2024), pp. 48-55.
    【URL】

  • Lis Pereira, Fei Cheng, Wan Jou She, Masayuki Asahara, Ichiro Kobayashi (2024), “Prior Knowledge-Guided Adversarial Training”, Proceedings of the 9th Workshop on Representation Learning for NLP (RepL4NLP-2024), pp. 51-57.
    【URL】

  • Yoshiko Kawabata, Mai Omura, Hikari Konishi, Masayuki Asahara, Johane Takeuchi (2024), “Collection of Japanese Route Information Reference Expressions Using Maps as Stimuli”, Proceedings of the 4th Workshop on Spatial Language Understanding and Grounded Communication for Robotics (SpLU-RoboNLP 2024), pp. 30-35.
    【URL】

  • Natsumi Funasaki, Masataka Yano (2024), “Role of prosody and word order in identifying focus: evidence from pupillometry”, Language, Cognition, and Neuroscience, pp. 1-18.
    【DOI】

  • 川端 良子・大村 舞・浅原 正幸・竹内 誉羽 (2024), 「Double Cross Model に基づく相対位置情報アノテーション」, 『自然言語処理』, 31巻3号, pp. 1356-1375.
    【DOI】 | 【Bib】

  • Masataka Yano, Keiyu Niikuni, Ruri Shimura, Natsumi Funasaki, Masatoshi Oizumi (2024), “Producing non-basic word orders in (in)felicitous contexts: evidence from pupillometry and functional near-infrared spectroscopy (fNIRS)”, Language, Cognition, and Neuroscience, pp. 1-22.
    【DOI】

Awards

  • 言語処理学会30周年記念論文賞, 言語処理学会 (2024.10)
    • 浅原 正幸・金山 博・宮尾 祐介・田中 貴秋・大村 舞・村脇 有吾・松本 裕治
      「Universal Dependencies 日本語コーパス」
  • Outstanding Senior Area Chairs, The 2024 Conference on Empirical Methods in Natural Language Processing, Association for Computational Linguistics (2024.11)
    • Masayuki Asahara
  • Best Paper Award, Proceedings of the 28th Conference on Computational Natural Language Learning (2024.12)
    • Kohei Kajikawa, Yusuke Kubota, Yohei Oseki
      “Is Structure Dependence Shaped for Efficient Communication?: A Case Study on Coordination”
      【URL】

Collaborative Researches

  • 【共同利用型(B)】大規模言語モデルによる日本語古典語の生成 - 近藤 泰弘 (青山学院大学)
  • 【共同利用型(B)】ヘブライ語・ロシア語の語頭子音連続における調音の実態調査 - 横江 百合子(東洋学園大学)
  • 【共同利用型(C)】オープンかつ日本語に強い大規模言語モデルの構築 - 岡崎 直観(東京工業大学)
  • 【共同利用型(C)】可搬性に優れた大規模言語モデル技術の開発 - 高村 大也(産業技術総合研究所)
  • 【共同利用型(C)】日本語汎用大規模言語モデルの追加学習と学術・医療ドメインへの適応 - 相澤 彰子(国立情報学研究所)
  • 【他機構】国立情報学研究所 大規模言語モデル研究開発センター
  • 【他大学】東北大学 言語AI研究センター
  • 【企業】SB Intuitions 株式会社(~2025年3月)
  • 【企業】株式会社 ホンダ・リサーチ・インスティチュート・ジャパン(~2025年3月)
  • 【企業】NTTコミュニケーション科学基礎研究所(~2025年3月)

2023年度以前より継続のもの

Collaborative Researches

  • 【共同利用型(C)】係り受け情報を用いた日本語母語話者の情報処理過程解明のための基礎的研究 - 庵 功雄(一橋大学)(~2025年3月)
  • 【共同利用型(C)】BCCWJ/CSJ への生理指標アノテーション付加 - 小泉 政利 (東北大学)
  • 【企業】株式会社リクルート Megagon Labs「日本語版Universal Dependenciesに基づく日本語依存構造解析モデルの研究開発」
  • 【企業】株式会社ワークスアプリケーションズ「日本語事前学習モデルchiTraの研究開発」
  • 【企業】シェルパ・アンド・カンパニー株式会社「高速な日本語形態素解析器の開発及び解析モデルの公開」