国語研究所の施設整備に伴い,関連のサービスを次の期間,停止します。
期間:2024年4月27日(土)9:00~2024年4月29日(月・祝)17:30
対象:Web用例データベース(複合動詞,サ変動詞,形容詞)・『ひまわり』&関連資料(ダウンロードもできません),FishWatchr & FishWatchr Miniなど
[[全文検索システム『ひまわり』]] &color(red){&size(25){本ページは構築中です。};}; RIGHT:作成者:山口昌也 (国立国語研究所) RIGHT:2018-xx-xx #br *『青空文庫TOP100』パッケージの概要 [#ec8e3188] 本パッケージは,[[『青空文庫』>http://www.aozora.gr.jp/]]の[[アクセスランキング>http://www.aozora.gr.jp/access_ranking/]](2009-2017)からアクセス数上位100作品を抽出し,[[『ひまわり』>全文検索システム『ひまわり』]]用にインポートしたデータです。 - 使い方は,[[『青空文庫』パッケージ]]と同じです。 - 使い方は,[[『青空文庫』パッケージ>../『青空文庫』パッケージ]]と同じです。 - [[『青空文庫』パッケージ]]では,追加パッケージだった,形態素解析結果のアノテーションもデフォルトで同梱しています。 次のような利用方法を想定して,作成しました。 - 『ひまわり』で検索の練習がしたい。 - [[『青空文庫』パッケージ]]を使う前に,試してみたい。 //また,[[「作家別作品一覧拡充版」>http://www.aozora.gr.jp/index_pages/list_person_all_extended.zip]]や作品に含まれる文字数などの情報を取り込んでいます。 *収録データの内容 [#o33facbc] - サイト:[[『青空文庫』>http://www.aozora.gr.jp/]] - 収録作品 -- [[青空文庫アクセスランキング>http://www.aozora.gr.jp/access_ranking/]](2009-2017,XHTML版,[[全年合計結果]])のアクセス数上位100冊です。 -- ダウンロード後,[[『青空文庫』パッケージ]]と同様の方法で『ひまわり』にインポートしています。 *使用条件 [#te59028f] - 本パッケージの使用条件は,[[青空文庫収録ファイルの取り扱い規準>http://www.aozora.gr.jp/guide/kijyunn.html]]に準じます。 - 本ページで公開しているパッケージを利用したことにより直接的,間接的に生じる,いかなる損害も保証しません。 *ダウンロード [#g26eb865] //- [[『青空文庫TOP100』パッケージ(2018xxxx)>http://csd.ninjal.ac.jp/archives/Aozora/aozora_himawari_20171001.zip]](圧縮時約811MB,解凍時約1.2GB, ZIP形式,[[履歴・旧バージョン>./履歴]]) *使用方法 [#lcd27131] ** インストール方法 [#ad87ca23] + [[『ひまわり』>全文検索システム『ひまわり』]](ver.1.6以降)をインストールしてください。 + 『青空文庫』パッケージをダウンロードし,ダウンロードしたzipファイルを『ひまわり』にドラッグ&ドロップするか,[ファイル]⇒[インストール]で指定して下さい。 以上で,インストールは終了です。 // 次回以降は,『ひまわり』フォルダにインストールされた設定ファイル(config_aozora.xmlかconfig_aozora_db.xmlなど)を以下「検索」の説明にしたがって読み込んで下さい。 ** 検索 [#xd38c47d] // 『ひまわり』を起動し,[ファイル]→[新規]やドラッグ&ドロップで,『ひまわり』フォルダにある設定ファイル(config_aozora.xmlかconfig_aozora_db.xml) を読み込んでください。なお,設定ファイルは,上記のとおり,2種類を収録していますので,適宜使い分けてください。検索結果の時に詳しい検索方法については,全文検索システム『ひまわり』の利用者マニュアルを参照してください。 //-書誌情報は,基本的に[[「作家別作品一覧拡充版」>http://www.aozora.gr.jp/index_pages/list_person_all_extended_utf8.zip]](2016-04-01時点のデータを使用。リンク先は現在のものなので注意)に準じます。 //-- 「作家別作品一覧拡充版」から取り込んだ情報は,次のとおりです。なお,括弧内は,『ひまわり』の検索結果における欄名です。 //>>>作品ID,副題,初出,分類番号,文字遣い種別,姓(著者,*後述),名(著者,*後述),図書カードURL,人物ID,役割フラグ(役割),生年月日,没年月日,底本名1(底本名),底本出版社名1(底本出版社名),底本初版発行年1(底本初版発行年),入力に使用した版1(入力に使用した版),XHTML/HTMLファイルURL(ファイルURL) //-- 検索結果の「著者」欄の内容は,「作家別作品一覧拡充版」の「姓」「名」欄を統合したものです。統合後,姓名の間は,空白で区切られます。また,例2のように,姓名がカタカナと記号からなる場合は,「名」「姓」の順に表示しています。 //---例1: 「芥川」「竜之介」 ⇒ 「芥川 竜之介」 //---例2: 「ポー」「エドガー・アラン」 ⇒ 「エドガー・アラン ポー」 //-- 「著者」欄などで複数の著者が入る場合は,「::」で区切られます。 //- 「文字数」欄は,当該の作品の「本文」に含まれる文字数です。ここで言う「本文」とは,青空文庫のXMLファイルの中から,冒頭の作品名,著者名,末尾の書誌情報・注記などを除いたテキスト部分です。半角空白や改行は,文字数に含まれていません。 //- 収録作品のリストは,[ツール]⇒[一覧]⇒[作品別書誌情報一覧]を実行して下さい。 *アンケート [#u7dd9448] よろしければ,アンケートにもお答えください。なお,このアンケートは,『ひまわり』をどのような方にお使いいただいているかを調べ,今後の研究・開発に活用させていただくためのものです。アンケート結果は,これらの目的以外には利用いたしません。 #qa1(masaya,masaya,[himawari-aozora_top100],所属:大学・高専等/小中高・専門学校等/研究機関/企業/個人/その他,身分:教職員/研究員/学生/その他,専門分野:日本語(国語)学/英語学/言語学/言語教育/自然言語処理・人工知能/その他(人文社会系)/その他(理工系),母国語:日本語/日本語以外,年齢:10代未満/10代/20代/30代/40代/50代/60代/70代以上,使用OS:Windows/Mac/Linux/その他,コンピュータ使用歴:1年未満/1年以上3年未満/3年以上,:TEXTAREA:ご意見・ご感想:3:81) *謝辞 [#xc4d4323] 収録作品の著者の方々,有益なデータを提供してくださる青空文庫の運営者,工作員の方々に心より感謝いたします。