[[全文検索システム『ひまわり』]]
* 『青空文庫』サンプルとは [#l5e5c989]
『青空文庫』サンプルは,テスト検索用の言語資料として,[[『青空文庫』>http://www.aozora.gr.jp/]]の次の4作品を収録したものです。
- 芥川龍之介:猿蟹合戦
- 芥川龍之介:蜘蛛の糸
- 夏目漱石:こころ
- 夏目漱石:吾輩は猫である
収録に際しては,次の処理を行なっています。
- 上記作品の XHTML版を[[テキストインポート機能]]により,『ひまわり』にインポート
- 形態素解析システム MeCab の解析結果を[[自動アノテーション機能]]により付与
* 使い方 [#n54ae04d]
**2.1 『青空文庫』サンプルを検索対象にするには [#ac1e8410]
『青空文庫』サンプルを検索対象とするには,『ひまわり』を起動し,[ファイル]→[新規]で,config.xml を読み込んで下さい。デフォルトで,config.xml を読み込むようになっています。なお,config.xml と config_aozora_sample.db.xml は,同一のファイルです。
**2.2 検索対象の詳細 [#t61e330f]
検索対象は,次のように,メニューで選択することができます。メニューの詳細については,[[「6.3節 自動アノテーション」>全文検索システム『ひまわり』/利用者マニュアル/1_5/6.言語資料にアノテーションする#q6041ade]]を参照してください。また,検索一般については,[[4.1 節>全文検索システム『ひまわり』/利用者マニュアル/1_2/4.詳細な検索を行う]]もあわせてご覧ください。
&ref(全文検索システム『ひまわり』/利用者マニュアル/1_5/6.言語資料にアノテーションする/search_target_db.png,center,検索対象の選択);
** 2.3 検索結果の見方 [#pf30b448]
-''Path'': 青空文庫でのファイル名,および,インポート時のディレクトリ構成
-''タイトル'': 作品のタイトル名
-''著者'': 作品の著者名
-''基本形'': キー欄の文字列の基本形(キー欄の文字列が形態素だった場合のみ)
-''読み'': キー欄の文字列の読み(キー欄の文字列が形態素だった場合のみ)
-''品詞'': キー欄の文字列の品詞(キー欄の文字列が形態素だった場合のみ)
-''メモ1'': 人手アノテーション用フィールド(自由記述)
-''メモ2'': 人手アノテーション用フィールド(選択)
* 謝辞 [#f63b2c1c]
収録作品の著者の方々,有益なデータを提供してくださる青空文庫の運営者,工作員の方々に心より感謝いたします。