#author("2021-10-31T14:09:36+09:00","default:rd","rd") [[全文検索システム『ひまわり』]] * 『青空文庫』サンプルとは [#l5e5c989] 『青空文庫』サンプルは,テスト検索用の言語資料として,[[『青空文庫』>http://www.aozora.gr.jp/]]の次の4作品を収録したものです。 『青空文庫』サンプルは,全文検索システム『ひまわり』のテスト検索用の言語資料として,[[『青空文庫』>http://www.aozora.gr.jp/]]の次の4作品を収録したものです。『ひまわり』にデフォルトで同梱されています。 - 芥川龍之介:猿蟹合戦 - 芥川龍之介:蜘蛛の糸 - 夏目漱石:こころ - 夏目漱石:吾輩は猫である 収録に際しては,次の処理を行なっています。 - 上記作品の XHTML版を[[テキストインポート機能]]により,『ひまわり』にインポート - 形態素解析システム MeCab の解析結果を[[自動アノテーション機能]]により付与 - 上記作品の XHTML版を[[テキストインポート機能>全文検索システム『ひまわり』/利用者マニュアル/1_7/7.言語資料をインポートする]]により,『ひまわり』にインポート - インポート時に形態素解析システム MeCab により単語情報を付与 * 使い方 [#n54ae04d] **2.1 『青空文庫』サンプルを検索対象にするには [#ac1e8410] 『青空文庫』サンプルを検索対象とするには,『ひまわり』を起動し,[ファイル]→[新規]で,config.xml を読み込んで下さい。デフォルトで,config.xml を読み込むようになっています。 * 『青空文庫』サンプルを検索対象にするには [#n54ae04d] - 『青空文庫』サンプルを検索対象とするには,『ひまわり』を起動し,[ファイル]→[コーパス選択]で「『青空文庫』サンプル」を選択してください。 - コーパス選択時に「外部DB」欄を「あり(sd)」にすると,単語検索ができるようになります。 :config_aozora_sample.db.xml|default :config_aozora_sample.xml|default **2.2 検索対象の詳細 [#t61e330f] * 謝辞 [#f63b2c1c] 収録作品の著者の方々,有益なデータを提供してくださる青空文庫の運営者,工作員の方々に心より感謝いたします。