平成22年1月30日(土)13:00~18:30
国立国語研究所 大会議室
コーパスを活用した日本語辞書編纂の可能性を考える場合,英語研究での知見や経験の蓄積に注目することも重要である。本発表では,英語辞書編纂におけるコーパス活用の小史を概観し,最近のコーパス準拠英英辞書のコンテンツ構成について紹介した。あわせて,辞書編纂に不可欠な語や意味の頻度情報をコーパスから取得する際の方法論と問題点についてまとめた。
「つくる」のサンプル項目を提示し,どのような形で構成するか考える材料を提供した。用法の羅列ではなく,説明的につかみやすいことを大きな目的として作成した。
本発表では,日本語・マラーティー語基本動詞辞典作成時に活用したオンライン上でのWikiを使った共同執筆システムの概要を紹介した。本システムでは,Wikiのデータを擬似XMLデータとして保持し,それを整形処理し印刷物に変換する仕組みを取っている。今後本プロジェクトで活用するに当たってのメリット・問題点を検討した。
構築中の「現代日本語書き言葉均衡コーパス」を利用して,基本動詞選定のための基礎データ作成について紹介した。この基礎データは,見出し語ごとにコーパスにおける使用頻度や異なるジャンルでの分布状況を記述するものである。このデータをもとに動詞の用法をまとめる際にどのような情報が必要になるか具体例とともに検討し,既存の語彙リストをデータとして利用する際の問題点も指摘した。