UniDic

  • new! 2014/03/31 中古和文UniDic Ver.1.4 を公開しました。日本語歴史コーパス平安時代編の構築に用いられた辞書です。 近代文語UniDic 1.4と同期しています。
  • 2012/05/02 科研費報告書『和文系資料を対象とした形態素解析辞書の開発』(2012),『中古和文UniDic 短単位規程集』(2012)のPDFを公開しました。

形態素解析辞書 : 中古和文UniDic

概要

  • 中古和文UniDicは、UniDicをもとにして中古の和文系資料(いわゆる古典,古文)を解析できるようにした形態素解析辞書です。(現代語版のUniDicはこちら
  • 主として校訂済みの中古和文(仮名文学作品)を対象としています。他の種類のテキストでは必ずしも良い解析結果が得られません。
  • MeCab版を公開しています(ChaSen版は公開していません)。

和文茶まめ(Windows版)画面

  • 手軽に解析を行うためのツール
    wabun_chamame05.png

解析精度比較

  • 中古和文テキストの解析精度を他のUniDicと比較しました。
  • テストデータは約2万5千語を文単位でランダムサンプリングしたものです(学習に利用せず,ただし中古和文UniDicにとっての未知語なし)。
    wabun_compare05.png

利用条件

(現代語版UniDic 1.3.12と同等の内容です)

中古和文UniDic 利用条件

  1. 中古和文UniDic の著作権は,小木曽智信,小椋秀樹,田中牧郎,近藤明日子,須永哲矢 および The UniDic consortium(代表:伝康晴)が保持する。
  2. 中古和文UniDic を複製又は改変することは,個人的な利用に限り認める。
  3. 中古和文UniDic 及びこれを改変したものを再配布してはならない。
  4. 中古和文UniDic を利用して行った研究等の成果を公表する場合は,中古和文UniDic を利用したことを明記すること。
  5. 営利を目的として,中古和文UniDic を利用する場合は,事前に著作権者と協議すること。
  6. 中古和文UniDic を利用することによって,直接的・間接的に生じたいかなる損害についても,著作権者は賠償する責任を負わない。
  7. 本文書に定めのない事項については,著作権者と協議すること。

ダウンロード

中古和文UniDicのダウンロード

恐れ入りますが,次のアンケートにお答えください。アンケート結果を送信するとダウンロードページに移動します。
なお,このアンケートは『中古和文UniDic』をどのような方にお使いいただいているかを調べるものです。お送りいただいた情報は,今後の研究・開発に利用させていただきます。

所属
大学・高専等 小中高・専門学校等 研究機関 企業 個人 その他
身分
教職員 研究員 学生 その他
専門分野
日本語(国語)学 英語学 言語学 言語教育 自然言語処理・人工知能 その他(人文社会系) その他(理工系)
年齢
10代未満 10代 20代 30代 40代 50代 60代 70代以上
使用OS
Windows Mac Linux その他
コンピュータ使用歴
1年未満 1年以上3年未満 3年以上5年未満 5年以上10年未満 10年以上

ソース辞書や旧バージョンの入手

ソース辞書(テキスト形式の配布辞書)や旧バージョンについては現在ダウンロードサービスを行っておりません。
利用を希望される方は下記の連絡先までメールでお問い合わせください。

インストール

  • Windowsパッケージの場合は,ダウンロードしたファイルを解凍し,インストーラ(INSTALL.EXE)を起動して指示に従ってください。インストール終了後,「和文茶まめ」のアイコンから起動してください。
  • 利用するには「MeCab 0.96」以降が必要です。あらかじめインストールしておくか、中古和文UniDicをインストールした後ですぐにインストールしてください。

科研費報告書

平成21(2009)−平成23(2011)年度科学研究費補助金基盤研究(C)「和文系資料を対象とした形態素解析辞書の開発」 課題番号21520492

参考文献

(中古和文UniDicに限らない)UniDic全般に関する参考文献については、UniDicダウンロードサイトのこちらのページをご覧ください。

  • 小木曽智信・小椋秀樹・田中牧郎・近藤明日子・伝康晴「中古和文を対象とした形態素解析辞書の開発」『情報処理学会研究報告 人文科学とコンピュータ』Vol.2010-CH-85(No.4) pp.1-8 2010年2月
    →情報処理学会 電子図書館
  • Toshinobu Ogiso, Mamoru Komachi, Yasuharu Den and Yuji Matsumoto. UniDic for Early Middle Japanese: a Dictionary for Morphological Analysis of Classical Japanese. In Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC): Posters, pp.911-915. Istanbul, Turkey, May 2012. http://www.lrec-conf.org/proceedings/lrec2012/pdf/906_Paper.pdf
  • 小木曽智信「中古仮名文学作品の形態素解析」『日本語の研究』第9巻4号(通巻255号) pp.49-62,2013年10月 →CiNii

連絡先

中古和文UniDicに関するお問い合わせは次のアドレスにお願いします。
小木曽智信 mail.png

更新履歴

  • 2014/03/31 中古和文UniDic Ver.1.4 Windows版パッケージを公開。
  • 2012/12/06 中古和文UniDic Ver.1.3 Windows版パッケージを公開。
  • 2012/05/02 中古和文UniDic Ver.1.2 Windows版パッケージを公開。
  • 2012/05/02 科研費報告書『和文系資料を対象とした形態素解析辞書の開発』(2012),『中古和文UniDic 短単位規程集』(2012)のPDFを公開。
  • 2010/10/21 中古和文UniDic Ver.0.5 Windows版パッケージ及びMeCab用バイナリ辞書を公開。

謝辞

中古和文UniDicの開発にあたっては次の研究補助金・助成金等を受けました。

なお、この辞書の元となったUniDicは、文部科学省科学研究費補助金特定領域研究「代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備」(平成18〜22年度,領域代表者:国立国語研究所・前川喜久雄)ほかの助成を受けて開発が行われたものです。


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2014-03-31 (月) 17:06:41 (911d)