国語研究所の施設整備に伴い,関連のサービスを次の期間,停止します。
期間:2024年4月27日(土)9:00~2024年4月29日(月・祝)17:30
対象:Web用例データベース(複合動詞,サ変動詞,形容詞)・『ひまわり』&関連資料(ダウンロードもできません),FishWatchr & FishWatchr Miniなど
[[UniDic]]
//&color(red){準備中};
&color(red){2010/10/21 ''中古和文UniDic'' ''Ver.0.5''(Windowsパッケージ及びMeCab用バイナリ辞書)をリリースしました。};
*形態素解析辞書 : 中古和文UniDic [#yd8044dd]
RIGHT:''小木曽 智信''
#contents
**概要 [#y1c69572]
-中古和文UniDicは、[[UniDic>http://download.unidic.org/]]をもとにして中古の和文系資料(いわゆる古典,古文)を解析できるようにした形態素解析辞書です。([[現代語版のUniDicはこちら>http://download.unidic.org/]])
-主として校訂済みの中古和文(仮名文学作品)を対象としています。他の種類のテキストでは必ずしも良い解析結果が得られません。
-MeCab版を公開しています(ChaSen版は公開していません)。
***和文茶まめ(Windows版)画面 [#m51976c1]
-手軽に解析を行うためのツール
#ref(wabun_chamame05.png,,100%);
***解析精度比較 [#n80bfd11]
-中古和文テキストの解析精度を他のUniDicと比較しました。
-テストデータは約2万5千語を文単位でランダムサンプリングしたものです(学習に利用せず,ただし中古和文UniDicにとっての未知語なし)。
#ref(wabun_compare05.png,,100%);
**利用条件 [#u7300511]
(現代語版UniDicと同等の内容です)
***中古和文UniDic ver.0.5 利用条件 [#c69318c2]
+中古和文UniDic ver.0.5 の著作権は,小木曽智信,小椋秀樹,田中牧郎,近藤明日子,須永哲矢 および The UniDic consortium(代表:伝康晴)が保持する。
+中古和文UniDic ver.0.5 を複製又は改変することは,個人的な利用に限り認める。
+中古和文UniDic ver.0.5 及びこれを改変したものを再配布してはならない。
+中古和文UniDic ver.0.5 を利用して行った研究等の成果を公表する場合は,中古和文UniDic ver.0.5 を利用したことを明記すること。
+営利を目的として,中古和文UniDic ver.0.5 を利用する場合は,事前に著作権者と協議すること。
+中古和文UniDic ver.0.5 を利用することによって,直接的・間接的に生じたいかなる損害についても,著作権者は賠償する責任を負わない。
+本文書に定めのない事項については,著作権者と協議すること。
**ダウンロード [#gacaeebe]
***中古和文UniDicのダウンロード [#hb89ebc9]
恐れ入りますが,次のアンケートにお答えください。アンケート結果を送信するとダウンロードページに移動します。&br;
なお,このアンケートは『中古和文UniDic』をどのような方にお使いいただいているかを調べるものです。お送りいただいた情報は,今後の研究・開発に利用させていただきます。
//-''準備中:21日中に公開します。''
#qa2w(kindai-corpus@ninjal.ac.jp,kindai-corpus@ninjal.ac.jp,[UniDic-CWJ_v05],所属:大学・高専等/小中高・専門学校等/研究機関/企業/個人/その他,身分:教職員/研究員/学生/その他,専門分野:日本語(国語)学/英語学/言語学/言語教育/自然言語処理・人工知能/その他(人文社会系)/その他(理工系),年齢:10代未満/10代/20代/30代/40代/50代/60代/70代以上,使用OS:Windows/Mac/Linux/その他,コンピュータ使用歴:1年未満/1年以上3年未満/3年以上5年未満/5年以上10年未満/10年以上)
***ソース辞書や旧バージョンの入手 [#gc04c43c]
ソース辞書(テキスト形式の配布辞書)やChaSen版,旧バージョンについては現在ダウンロードサービスを行っておりません。&br;
利用を希望される方は[[下記の連絡先>#q40aa90a]]までメールでお問い合わせください。
**インストール [#t3d833a8]
-Windowsパッケージの場合は,ダウンロードしたファイルを解凍し,インストーラ(INSTALL.EXE)を起動して指示に従ってください。インストール終了後,「和文茶まめ」のアイコンから起動してください。
-利用するには「MeCab 0.96」以降以降が必要です。あらかじめインストールしておくか、中古和文UniDicをインストールした後ですぐにインストールしてください。
--MeCabは次のページからダウンロードできます。&br;
http://mecab.sourceforge.net/#download
**参考文献 [#wf64f0f0]
(中古和文UniDicに限らない)UniDic全般に関する参考文献については、[[UniDicダウンロードサイトのこちらのページ>https://www.tokuteicorpus.jp/dist/modules/system/modules/menu/main.php?page_id=2598&op=change_page]]をご覧ください。
***学会発表 [#n02053df]
-小木曽智信・小椋秀樹・田中牧郎・近藤明日子・伝康晴「中古和文を対象とした形態素解析辞書の開発」『情報処理学会研究報告 人文科学とコンピュータ』Vol.2010-CH-85(No.4) pp.1-8 2010年2月&br;
[[→情報処理学会 電子図書館>http://id.nii.ac.jp/1001/00067615/]]
-小木曽智信・小椋秀樹・近藤明日子・須永哲矢「形態素解析辞書「中古和文UniDic」とその活用例」『日本語学会2010年度秋季大会予稿集』 pp.243-248 2010年10月
**連絡先 [#q40aa90a]
中古和文UniDicに関するお問い合わせは次のアドレスにお願いします。&br;
小木曽智信 &ref(mail.png);
**更新履歴 [#z11ce83f]
-2010/10/21 中古和文UniDic Ver.0.5 Windows版パッケージ及びMeCab用バイナリ辞書を公開。
**謝辞 [#a4c5d9e5]
-本辞書の開発には,日本学術振興会科学研究費補助金(基盤研究(C))「和文系資料を対象とした形態素解析辞書の開発」(平成21〜23年度,代表者:小木曽智信)による補助を得ました。
なお、この辞書の元となった[[UniDic>http://www.tokuteicorpus.jp/dist/]]は、文部科学省科学研究費補助金特定領域研究「代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備」(平成18〜22年度,領域代表者:国立国語研究所・前川喜久雄)ほかの助成を受けて開発が行われているものです。詳しくは[[リンク先>http://www.tokuteicorpus.jp/dist/]]をご覧ください。