全文検索システム『ひまわり』/『分類語彙表』を『ひまわり』で利用する方法
をテンプレートにして作成
開始行:
[[全文検索システム『ひまわり』]]
#br
&color(red){&size(20){現在,本コンテンツは,保守されてい...
#br
*1.はじめに [#e1f51f05]
-[[『分類語彙表増補改訂版』(研究用データ)>http://www.ni...
-本資料の内容は,次の環境でテストしています。本資料の内容...
--『ひまわり』(ver.1.2β03)
--環境1
---OS: WindowsXP(SP2)
---Memory: 512MB
---Perl: ActivePerl ver.5.8.6.811
--環境2
---OS: Debian GNU/Linux ver.3.0
---Memory: 1GB
---Perl: ActivePerl ver.5.8.6.811
-実行例は,次のとおりです。画像をクリックすると大きくなり...
#br
&ref(全文検索システム『ひまわり』/実行例/snapshot_bunrui....
*2.準備 [#pd40fdaf]
-『分類語彙表増補改訂版』(研究用データ)を入手してくださ...
--入手方法は,[[『分類語彙表増補改訂版』(研究用データ)>...
--[[『分類語彙表増補改訂版』(書籍版)>http://www.ninjal....
-『分類語彙表』→『ひまわり』変換パッケージ(&ref(bun2him.l...
-Perl (ver.5.8.6 以上) をお手持ちのPCにインストールして...
--Perl は,変換に必要なプログラミング言語です。
--[[ActiveState:http://www.activestate.com/]] で無償で配...
---[[Windows 版ダウンロード:http://downloads.activestate....
---[[Linux 版ダウンロード:http://downloads.activestate.co...
--詳しくは,ActiveState の [[ActivePerl のページ:http://w...
-[[『ひまわり』 ver.1.3 >全文検索システム『ひまわり』/ダ...
//--ver.1.2β02 以前のバージョンでは,一部の機能に不具合が...
//--また,『太陽コーパス』に同梱されている『ひまわり』は ...
*3.変換手順 [#f5879c60]
**3.1 パッケージの解凍 [#oc6cf374]
-「準備」のところで示した &ref(bun2him.lzh); を解凍してく...
-解凍すると,Bun2Himawari フォルダが作成されます。
-パッケージの内容
--README.txt
--bun2himawari.pl
--b2h.bat
--config_bunrui.xml
--Corpora フォルダ
**3.2 分類語彙表のデータのインストール [#bf9ab50e]
-『分類語彙表増補改訂版』(研究用データ)に同梱されている...
-bunruidb.txt を上記 3.1 で作成された Bun2Himawari フォル...
**3.3 変換の実行 [#zed65028]
+次のいずれかの処理を行ってください。
++(Windows をお使いの方のみ): Bun2Himawari フォルダにある...
++(Windows, Linux 共通): Bun2Himawari フォルダにおいて,...
perl bun2himawari.pl bunruidb.txt corpus.xml
+corpus.xml ファイルが作成されたかどうか確認してください...
+corpos.xml を Corpora 中の Bunrui フォルダに移動してくだ...
+Corpora フォルダと config_bunrui.xml を『ひまわり』がイ...
**3.4 索引付け [#qbd0be6c]
次に,作成した corpus.xml に対して,「索引付け」を行い...
索引付けの手順は,次のとおりです。
+『ひまわり』を起動してください。
+ [ファイル]→[新規] で,設定ファイルの config_bunrui.xml ...
+ [ツール]→[インデックス生成]を実行してください。この処理...
+「インデックス生成が終了しました。」と表示されれば,索引...
&br;なお,なんらかの理由で,インデックス生成を再度行うと...
以上で,検索用データ作成は終了です。
*4.使い方 [#j988305e]
-『ひまわり』を起動し,[ファイル]→[新規] で,設定ファイル...
-[[『分類語彙表』サンプルの2節「使い方」>全文検索システ...
*5.その他 [#c36f8fb6]
-『分類語彙表増補改訂版』(研究用データ)を UFT-16 に変換...
終了行:
[[全文検索システム『ひまわり』]]
#br
&color(red){&size(20){現在,本コンテンツは,保守されてい...
#br
*1.はじめに [#e1f51f05]
-[[『分類語彙表増補改訂版』(研究用データ)>http://www.ni...
-本資料の内容は,次の環境でテストしています。本資料の内容...
--『ひまわり』(ver.1.2β03)
--環境1
---OS: WindowsXP(SP2)
---Memory: 512MB
---Perl: ActivePerl ver.5.8.6.811
--環境2
---OS: Debian GNU/Linux ver.3.0
---Memory: 1GB
---Perl: ActivePerl ver.5.8.6.811
-実行例は,次のとおりです。画像をクリックすると大きくなり...
#br
&ref(全文検索システム『ひまわり』/実行例/snapshot_bunrui....
*2.準備 [#pd40fdaf]
-『分類語彙表増補改訂版』(研究用データ)を入手してくださ...
--入手方法は,[[『分類語彙表増補改訂版』(研究用データ)>...
--[[『分類語彙表増補改訂版』(書籍版)>http://www.ninjal....
-『分類語彙表』→『ひまわり』変換パッケージ(&ref(bun2him.l...
-Perl (ver.5.8.6 以上) をお手持ちのPCにインストールして...
--Perl は,変換に必要なプログラミング言語です。
--[[ActiveState:http://www.activestate.com/]] で無償で配...
---[[Windows 版ダウンロード:http://downloads.activestate....
---[[Linux 版ダウンロード:http://downloads.activestate.co...
--詳しくは,ActiveState の [[ActivePerl のページ:http://w...
-[[『ひまわり』 ver.1.3 >全文検索システム『ひまわり』/ダ...
//--ver.1.2β02 以前のバージョンでは,一部の機能に不具合が...
//--また,『太陽コーパス』に同梱されている『ひまわり』は ...
*3.変換手順 [#f5879c60]
**3.1 パッケージの解凍 [#oc6cf374]
-「準備」のところで示した &ref(bun2him.lzh); を解凍してく...
-解凍すると,Bun2Himawari フォルダが作成されます。
-パッケージの内容
--README.txt
--bun2himawari.pl
--b2h.bat
--config_bunrui.xml
--Corpora フォルダ
**3.2 分類語彙表のデータのインストール [#bf9ab50e]
-『分類語彙表増補改訂版』(研究用データ)に同梱されている...
-bunruidb.txt を上記 3.1 で作成された Bun2Himawari フォル...
**3.3 変換の実行 [#zed65028]
+次のいずれかの処理を行ってください。
++(Windows をお使いの方のみ): Bun2Himawari フォルダにある...
++(Windows, Linux 共通): Bun2Himawari フォルダにおいて,...
perl bun2himawari.pl bunruidb.txt corpus.xml
+corpus.xml ファイルが作成されたかどうか確認してください...
+corpos.xml を Corpora 中の Bunrui フォルダに移動してくだ...
+Corpora フォルダと config_bunrui.xml を『ひまわり』がイ...
**3.4 索引付け [#qbd0be6c]
次に,作成した corpus.xml に対して,「索引付け」を行い...
索引付けの手順は,次のとおりです。
+『ひまわり』を起動してください。
+ [ファイル]→[新規] で,設定ファイルの config_bunrui.xml ...
+ [ツール]→[インデックス生成]を実行してください。この処理...
+「インデックス生成が終了しました。」と表示されれば,索引...
&br;なお,なんらかの理由で,インデックス生成を再度行うと...
以上で,検索用データ作成は終了です。
*4.使い方 [#j988305e]
-『ひまわり』を起動し,[ファイル]→[新規] で,設定ファイル...
-[[『分類語彙表』サンプルの2節「使い方」>全文検索システ...
*5.その他 [#c36f8fb6]
-『分類語彙表増補改訂版』(研究用データ)を UFT-16 に変換...
ページ名: