UniDic

  • new! 2017/11/01 2017年8月よりUniDicの情報をまとめた新しいサイトがオープンしました。今後はこちらのページをご覧ください。 http://unidic.ninjal.ac.jp/ このページは更新は終了します。
  • 2012/05/02 科研費報告書『和文系資料を対象とした形態素解析辞書の開発』(2012),『中古和文UniDic 短単位規程集』(2012)のPDFを公開しました。

形態素解析辞書 : 中古和文UniDic


概要

  • 中古和文UniDicは、UniDicをもとにして中古の和文系資料(いわゆる古典,古文)を解析できるようにした形態素解析辞書です。(現代語版のUniDicはこちら
  • 主として校訂済みの中古和文(仮名文学作品)を対象としています。他の種類のテキストでは必ずしも良い解析結果が得られません。
  • MeCab版を公開しています(ChaSen版は公開していません)。

和文茶まめ(Windows版)画面

  • 手軽に解析を行うためのツール
    wabun_chamame05.png

解析精度比較

  • 中古和文テキストの解析精度を他のUniDicと比較しました。
  • テストデータは約2万5千語を文単位でランダムサンプリングしたものです(学習に利用せず,ただし中古和文UniDicにとっての未知語なし)。
    wabun_compare05.png

利用条件

(現代語版UniDic 1.3.12と同等の内容です)

中古和文UniDic 利用条件

  1. 中古和文UniDic の著作権は,小木曽智信,小椋秀樹,田中牧郎,近藤明日子,須永哲矢 および The UniDic consortium(代表:伝康晴)が保持する。
  2. 中古和文UniDic を複製又は改変することは,個人的な利用に限り認める。
  3. 中古和文UniDic 及びこれを改変したものを再配布してはならない。
  4. 中古和文UniDic を利用して行った研究等の成果を公表する場合は,中古和文UniDic を利用したことを明記すること。
  5. 営利を目的として,中古和文UniDic を利用する場合は,事前に著作権者と協議すること。
  6. 中古和文UniDic を利用することによって,直接的・間接的に生じたいかなる損害についても,著作権者は賠償する責任を負わない。
  7. 本文書に定めのない事項については,著作権者と協議すること。

ダウンロード

中古和文UniDicのダウンロード

恐れ入りますが,次のアンケートにお答えください。アンケート結果を送信するとダウンロードページに移動します。
なお,このアンケートは『中古和文UniDic』をどのような方にお使いいただいているかを調べるものです。お送りいただいた情報は,今後の研究・開発に利用させていただきます。

インストール

  • Windowsパッケージの場合は,ダウンロードしたファイルを解凍し,インストーラ(INSTALL.EXE)を起動して指示に従ってください。インストール終了後,「和文茶まめ」のアイコンから起動してください。
  • 利用するには「MeCab 0.96」以降が必要です。あらかじめインストールしておくか、中古和文UniDicをインストールした後ですぐにインストールしてください。

科研費報告書

平成21(2009)−平成23(2011)年度科学研究費補助金基盤研究(C)「和文系資料を対象とした形態素解析辞書の開発」 課題番号21520492

参考文献

(中古和文UniDicに限らない)UniDic全般に関する参考文献については、UniDicダウンロードサイトのこちらのページをご覧ください。

  • 小木曽智信・小椋秀樹・田中牧郎・近藤明日子・伝康晴「中古和文を対象とした形態素解析辞書の開発」『情報処理学会研究報告 人文科学とコンピュータ』Vol.2010-CH-85(No.4) pp.1-8 2010年2月
    →情報処理学会 電子図書館
  • Toshinobu Ogiso, Mamoru Komachi, Yasuharu Den and Yuji Matsumoto. UniDic for Early Middle Japanese: a Dictionary for Morphological Analysis of Classical Japanese. In Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC): Posters, pp.911-915. Istanbul, Turkey, May 2012. http://www.lrec-conf.org/proceedings/lrec2012/pdf/906_Paper.pdf
  • 小木曽智信「中古仮名文学作品の形態素解析」『日本語の研究』第9巻4号(通巻255号) pp.49-62,2013年10月 →CiNii

連絡先

中古和文UniDicに関するお問い合わせは次のアドレスにお願いします。
小木曽智信 mail.png

更新履歴

  • 2017/11/01  更新を停止。今後はこちらのページをご覧ください。http://unidic.ninjal.ac.jp/
  • 2014/03/31 中古和文UniDic Ver.1.4 Windows版パッケージを公開。
  • 2012/12/06 中古和文UniDic Ver.1.3 Windows版パッケージを公開。
  • 2012/05/02 中古和文UniDic Ver.1.2 Windows版パッケージを公開。
  • 2012/05/02 科研費報告書『和文系資料を対象とした形態素解析辞書の開発』(2012),『中古和文UniDic 短単位規程集』(2012)のPDFを公開。
  • 2010/10/21 中古和文UniDic Ver.0.5 Windows版パッケージ及びMeCab用バイナリ辞書を公開。

謝辞

中古和文UniDicの開発にあたっては次の研究補助金・助成金等を受けました。

なお、この辞書の元となったUniDicは、文部科学省科学研究費補助金特定領域研究「代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備」(平成18〜22年度,領域代表者:国立国語研究所・前川喜久雄)ほかの助成を受けて開発が行われたものです。


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2017-11-02 (木) 05:52:59 (45d)