#author("2021-10-31T14:09:36+09:00","default:rd","rd") [[全文検索システム『ひまわり』]] * 『青空文庫』サンプルとは [#l5e5c989] 『青空文庫』サンプルは,テスト検索用の言語資料として,[[『青空文庫』>http://www.aozora.gr.jp/]]の次の4作品を収録したものです。 『青空文庫』サンプルは,全文検索システム『ひまわり』のテスト検索用の言語資料として,[[『青空文庫』>http://www.aozora.gr.jp/]]の次の4作品を収録したものです。『ひまわり』にデフォルトで同梱されています。 - 芥川龍之介:猿蟹合戦 - 芥川龍之介:蜘蛛の糸 - 夏目漱石:こころ - 夏目漱石:吾輩は猫である 収録に際しては,次の処理を行なっています。 - 上記作品の XHTML版を[[テキストインポート機能]]により,『ひまわり』にインポート - 形態素解析システム MeCab の解析結果を[[自動アノテーション機能]]により付与 - 上記作品の XHTML版を[[テキストインポート機能>全文検索システム『ひまわり』/利用者マニュアル/1_7/7.言語資料をインポートする]]により,『ひまわり』にインポート - インポート時に形態素解析システム MeCab により単語情報を付与 * 使い方 [#n54ae04d] **2.1 『青空文庫』サンプルを検索対象にするには [#ac1e8410] 『青空文庫』サンプルを検索対象とするには,『ひまわり』を起動し,[ファイル]→[新規]で,config.xml を読み込んで下さい。デフォルトで,config.xml を読み込むようになっています。なお,config.xml と config_aozora_sample.db.xml は,同一のファイルです。 * 『青空文庫』サンプルを検索対象にするには [#n54ae04d] - 『青空文庫』サンプルを検索対象とするには,『ひまわり』を起動し,[ファイル]→[コーパス選択]で「『青空文庫』サンプル」を選択してください。 - コーパス選択時に「外部DB」欄を「あり(sd)」にすると,単語検索ができるようになります。 **2.2 検索対象の詳細 [#t61e330f] 検索対象は,次のように,メニューで選択することができます。メニューの詳細については,[[「6.3節 自動アノテーション」>全文検索システム『ひまわり』/利用者マニュアル/1_5/6.言語資料にアノテーションする#q6041ade]]を参照してください。また,検索一般については,[[4.1 節>全文検索システム『ひまわり』/利用者マニュアル/1_2/4.詳細な検索を行う]]もあわせてご覧ください。 &ref(全文検索システム『ひまわり』/利用者マニュアル/1_5/6.言語資料にアノテーションする/search_target_db.png,center,検索対象の選択); ** 2.3 検索結果の見方 [#pf30b448] -''Path'': 青空文庫でのファイル名,および,インポート時のディレクトリ構成 -''タイトル'': 作品のタイトル名 -''著者'': 作品の著者名 -''基本形'': キー欄の文字列の基本形(キー欄の文字列が形態素だった場合のみ) -''読み'': キー欄の文字列の読み(キー欄の文字列が形態素だった場合のみ) -''品詞'': キー欄の文字列の品詞(キー欄の文字列が形態素だった場合のみ) -''メモ1'': 人手アノテーション用フィールド(自由記述) -''メモ2'': 人手アノテーション用フィールド(選択) * 謝辞 [#f63b2c1c] 収録作品の著者の方々,有益なデータを提供してくださる青空文庫の運営者,工作員の方々に心より感謝いたします。