#author("2021-09-07T15:28:09+09:00","default:rd","rd") [[全文検索システム『ひまわり』]] //&color(red){&size(25){本ページは構築中です。};}; RIGHT:作成者:山口昌也 (国立国語研究所) RIGHT:2020-05-12 #br *『青空文庫TOP100』パッケージの概要 [#ec8e3188] 本パッケージは,[[『青空文庫』>http://www.aozora.gr.jp/]]の[[アクセスランキング>http://www.aozora.gr.jp/access_ranking/]](2009-2017)に基づきアクセス数上位100作品を抽出し,[[『ひまわり』>全文検索システム『ひまわり』]]用にインポートしたデータです。[[『青空文庫』パッケージ>../『青空文庫』パッケージ]]では追加パッケージだった形態素解析結果も同梱(ver.1.6用のみ)しています。 次のような利用方法を想定して,作成しました。 - 『ひまわり』で検索の練習がしたい。 - [[『青空文庫』パッケージ>../『青空文庫』パッケージ]]を使う前に,試してみたい。 *収録データの内容 [#o33facbc] - サイト:[[『青空文庫』>http://www.aozora.gr.jp/]] - 収録作品 -- [[青空文庫アクセスランキング>http://www.aozora.gr.jp/access_ranking/]](2009-2017,XHTML版,&ref(./aozora_top_all(2009-2017).xlsx,全年合計結果);)のアクセス数&ref(./aozora_top100(2009-2017).xlsx,上位100冊);です。 -- ダウンロード後,[[『青空文庫』パッケージ>../『青空文庫』パッケージ]]と同様の方法で『ひまわり』にインポートしています。 -- 注記 --- 底本が複数ある作品は,アクセスランキングが上位の作品のみ収録しています。 --- 上下巻などに分冊されている作品でも,ランキングに入っている冊のみ収録しています。 --- 「[[萩原 朔太郎:月に吠える>http://www.aozora.gr.jp/cards/000067/files/859_21656.html]]」は,XHMLファイルがwell-formedでないので,不要なタグを削除した後,収録しています(&ref(./859_21656.html.patch,patch);)。 *使用条件 [#te59028f] - 本パッケージの使用条件は,[[青空文庫収録ファイルの取り扱い規準>http://www.aozora.gr.jp/guide/kijyunn.html]]に準じます。 - 本ページで公開しているパッケージを利用したことにより直接的,間接的に生じる,いかなる損害も保証しません。 *ダウンロード [#g26eb865] - [[『青空文庫TOP100』パッケージ(20200512)>https://csd.ninjal.ac.jp/archives/Aozora/aozora_himawari100_20200512.zip]](圧縮時約51MB,解凍時約93MB, ZIP形式,[[履歴・旧版>./履歴]]) *使用方法 [#lcd27131] ** インストール方法 [#ad87ca23] + [[『ひまわり』>全文検索システム『ひまわり』]]をインストールしてください。形態素解析結果を用いる場合は,ver.1.6が必要です。 + 『青空文庫』パッケージをダウンロードし,ダウンロードしたzipファイルを『ひまわり』にドラッグ&ドロップするか,[ファイル]⇒[インストール]で指定して下さい。 以上で,インストールは終了です。 次回以降は,『ひまわり』フォルダにインストールされた設定ファイルを以下「検索」の説明にしたがって読み込んで下さい。config_aozora100.xmlは形態素結果のアノテーション「なし」,config_aozora100.sd.xmlが「あり」です。 ** 検索 [#xd38c47d] 『ひまわり』を起動し,[ファイル]⇒[コーパス選択]で「青空文庫TOP100」を選択してください。「外部DB」が「なし」だと全文検索のみ,「あり(sd)」にすると形態素解析結果を利用した検索ができます。使い方の詳細は,[[『青空文庫』パッケージ>../『青空文庫』パッケージ#xd38c47d]]を参照して下さい。 *謝辞 [#xc4d4323] 収録作品の著者の方々,有益なデータを提供してくださる青空文庫の運営者,工作員の方々に心より感謝いたします。 *アンケート [#d2bd366e] #html{{ <div style="text-align:center"> <iframe width="95%" height= "480px" src= "https://forms.office.com/Pages/ResponsePage.aspx?id=WgYfnQMt70Gf98AUO1nLLK1_3DY3SyJFoMYGxl173Z1UN1lTWjA0ODgwVUFCMVlTSEtFMjZHUUFTRi4u&embed=true" frameborder= "0" marginwidth= "0" marginheight= "0" style= "border: solid thin #aaaaaa; max-width:100%; max-height:100vh; text-align: center" allowfullscreen webkitallowfullscreen mozallowfullscreen msallowfullscreen> </iframe> </div> }}