全文検索システム『ひまわり』/青空文庫の文書の利用2
をテンプレートにして作成
開始行:
#br
&color(red){&size(20){現在,本コンテンツは,保守されてい...
#br
*1.『「青空文庫」変換スクリプトパッケージ』の概要 [#ke3...
-このページでは,『「青空文庫」変換スクリプトパッケージ』...
-『「青空文庫」変換スクリプトパッケージ』は,書籍『インタ...
--本パッケージは,Windows 上で利用することを前提としてい...
--''書籍[[『インターネット図書館青空文庫』:http://www.har...
*2.資料について [#q4edb66d]
**2.1 『インターネット図書館青空文庫』 [#z3eaeac1]
-資料名:[[『インターネット図書館青空文庫』:http://www.ha...
-著者:野口英二
-出版社:株式会社 はる書房
-出版年:2005
-底本情報:作品ごとに異なる。このパッケージで変換の対象と...
-作成者名:青空文庫工作員(作品ごとに異なる)。詳細は,上...
-著作権情報:基本的に著作権が切れている作品のみ。詳細は,...
**2.2 対象作品について [#k916ae51]
本パッケージは,『インターネット図書館青空文庫』付属 DV...
-XHTML 形式のデータがある作品
-『ひまわり』が検索可能な XML 形式に変換できた作品
変換対象となったのは,2560 作品です。詳細は,[[''「青空...
*3.変換スクリプトの使用方法 [#a0a91d59]
**3.1 ダウンロード [#n0ed66d3]
+まず,はじめに『ひまわり』がお手持ちの PC にインストール...
--[[『ひまわり』(Ver.1.3)のダウンロード>全文検索システム...
--詳細は[[マニュアル>http://www.kokken.go.jp/lrc/index.ph...
+変換パッケージをダウンロードしてください。
--''「青空文庫」変換パッケージ &ref(himawari_aozora_1_0.l...
--本パッケージは [[GPL ライセンス>http://www.gnu.org/lice...
Copyright (c) 2007 Masaya YAMAGUCHI, Sae UENO, Miwa FU...
--また,本パッケージには,文字コード変換ツール [[nkf>http...
Network Kanji Filter Version 2.0.7 (2006-06-13) for Win32
Copyright (C) 1987, FUJITSU LTD. (I.Ichikawa),2000 S. Ko...
Copyright (C) 2002-2006 Kono, Furukawa, Naruse, mastodon
--パッケージの詳細については,[[パッケージ内容の詳細>./パ...
+ダウンロードしたファイルは,LZH 形式で圧縮されています。...
+解凍した変換パッケージを開くと,''Corpora'' というフォル...
この2点を Himawari フォルダの中に移してください(このフ...
~フォルダは,下図のようになります。以上で,変換の準備は完...
#br
#br
#ref(Himawari_folder.png);
#br
#br
**3.2 変換する [#vdcb6638]
+まずはじめに,『インターネット図書館青空文庫』の付属 DVD...
+先に移動した Corpora フォルダを開き,その中に aozora と...
&br;これをダブルクリックすると,下のような黒い画面が立ち...
&br;画面の指示通り,お使いのパソコンの CD-ROM ドライブま...
#br
#br
#ref(DOS_CDDrive.png);
#br
#br
+HTML ファイルのコピーが終わると,再び CD-ROM/DVD ドライ...
--画像ファイルの取り込み
--XHTML 形式から XML 形式への変換
--出来上った XML ファイルをまとめてコーパスファイルを生成
--文字コード・改行コードの調整
~&color(red){注:};「0個のファイルをコピーしました。」等...
&color(red){注:};この作業は10分から数十分かかることがあ...
+最後に,黒い画面に''「続行するには何かキーを押してくださ...
aozora フォルダの中には,''aozora.xml'' というファイル(...
**3.3 『ひまわり』索引付け [#z2e82471]
できあがったコーパスファイル(aozora.xml)を『ひまわり』...
+『ひまわり』を起動する。
+[ファイル]→[新規]を選択すると''「設定ファイルの選択」''...
#br
#br
#ref(Himawari_sinki.png);
#br
''&size(25){↓};''
#br
#ref(Himawari_index.png);
#br
+次に,[ツール]から[インデックス生成]を選択してください。...
#br
#br
#ref(Himawari_pulldown.png);
#br
''&size(25){↓};''
#br
#ref(Himawari_indexjikko.png);
#br
#br
#br
+「インデックス生成処理が正常に終了しました。」というウィ...
~これで検索の準備ができました。
*4.『ひまわり』で検索する [#z429ed3b]
+『ひまわり』を起動してください。[ファイル]→[新規]より co...
+「検索文字列」欄に検索したい文字列を入力し,「検索」をク...
+検索結果をより詳しく見たい場合,検索結果の当該の行をダブ...
''図1:検索結果''
#ref(tukaikata.png)
#br
#br
''図2:作品全体の表示''
#ref(browser.png)
#br
#br
-以下の情報は,ブラウザ表示の際にカーソルを合わせると上図...
--傍点・傍線・強調
--上付き・下付き
--ぶら下げ・字下げ・地付き
-底本情報を含む書誌情報(元の XHTML タグで <div class="bi...
※詳細な検索方法は,全文検索システム『ひまわり』の[[マニュ...
*謝辞 [#v3c1b1ff]
-『インターネット図書館青空文庫』の著者である野口英二氏,...
-本パッケージは,[[『博報「ことばと文化・教育」研究助成』...
終了行:
#br
&color(red){&size(20){現在,本コンテンツは,保守されてい...
#br
*1.『「青空文庫」変換スクリプトパッケージ』の概要 [#ke3...
-このページでは,『「青空文庫」変換スクリプトパッケージ』...
-『「青空文庫」変換スクリプトパッケージ』は,書籍『インタ...
--本パッケージは,Windows 上で利用することを前提としてい...
--''書籍[[『インターネット図書館青空文庫』:http://www.har...
*2.資料について [#q4edb66d]
**2.1 『インターネット図書館青空文庫』 [#z3eaeac1]
-資料名:[[『インターネット図書館青空文庫』:http://www.ha...
-著者:野口英二
-出版社:株式会社 はる書房
-出版年:2005
-底本情報:作品ごとに異なる。このパッケージで変換の対象と...
-作成者名:青空文庫工作員(作品ごとに異なる)。詳細は,上...
-著作権情報:基本的に著作権が切れている作品のみ。詳細は,...
**2.2 対象作品について [#k916ae51]
本パッケージは,『インターネット図書館青空文庫』付属 DV...
-XHTML 形式のデータがある作品
-『ひまわり』が検索可能な XML 形式に変換できた作品
変換対象となったのは,2560 作品です。詳細は,[[''「青空...
*3.変換スクリプトの使用方法 [#a0a91d59]
**3.1 ダウンロード [#n0ed66d3]
+まず,はじめに『ひまわり』がお手持ちの PC にインストール...
--[[『ひまわり』(Ver.1.3)のダウンロード>全文検索システム...
--詳細は[[マニュアル>http://www.kokken.go.jp/lrc/index.ph...
+変換パッケージをダウンロードしてください。
--''「青空文庫」変換パッケージ &ref(himawari_aozora_1_0.l...
--本パッケージは [[GPL ライセンス>http://www.gnu.org/lice...
Copyright (c) 2007 Masaya YAMAGUCHI, Sae UENO, Miwa FU...
--また,本パッケージには,文字コード変換ツール [[nkf>http...
Network Kanji Filter Version 2.0.7 (2006-06-13) for Win32
Copyright (C) 1987, FUJITSU LTD. (I.Ichikawa),2000 S. Ko...
Copyright (C) 2002-2006 Kono, Furukawa, Naruse, mastodon
--パッケージの詳細については,[[パッケージ内容の詳細>./パ...
+ダウンロードしたファイルは,LZH 形式で圧縮されています。...
+解凍した変換パッケージを開くと,''Corpora'' というフォル...
この2点を Himawari フォルダの中に移してください(このフ...
~フォルダは,下図のようになります。以上で,変換の準備は完...
#br
#br
#ref(Himawari_folder.png);
#br
#br
**3.2 変換する [#vdcb6638]
+まずはじめに,『インターネット図書館青空文庫』の付属 DVD...
+先に移動した Corpora フォルダを開き,その中に aozora と...
&br;これをダブルクリックすると,下のような黒い画面が立ち...
&br;画面の指示通り,お使いのパソコンの CD-ROM ドライブま...
#br
#br
#ref(DOS_CDDrive.png);
#br
#br
+HTML ファイルのコピーが終わると,再び CD-ROM/DVD ドライ...
--画像ファイルの取り込み
--XHTML 形式から XML 形式への変換
--出来上った XML ファイルをまとめてコーパスファイルを生成
--文字コード・改行コードの調整
~&color(red){注:};「0個のファイルをコピーしました。」等...
&color(red){注:};この作業は10分から数十分かかることがあ...
+最後に,黒い画面に''「続行するには何かキーを押してくださ...
aozora フォルダの中には,''aozora.xml'' というファイル(...
**3.3 『ひまわり』索引付け [#z2e82471]
できあがったコーパスファイル(aozora.xml)を『ひまわり』...
+『ひまわり』を起動する。
+[ファイル]→[新規]を選択すると''「設定ファイルの選択」''...
#br
#br
#ref(Himawari_sinki.png);
#br
''&size(25){↓};''
#br
#ref(Himawari_index.png);
#br
+次に,[ツール]から[インデックス生成]を選択してください。...
#br
#br
#ref(Himawari_pulldown.png);
#br
''&size(25){↓};''
#br
#ref(Himawari_indexjikko.png);
#br
#br
#br
+「インデックス生成処理が正常に終了しました。」というウィ...
~これで検索の準備ができました。
*4.『ひまわり』で検索する [#z429ed3b]
+『ひまわり』を起動してください。[ファイル]→[新規]より co...
+「検索文字列」欄に検索したい文字列を入力し,「検索」をク...
+検索結果をより詳しく見たい場合,検索結果の当該の行をダブ...
''図1:検索結果''
#ref(tukaikata.png)
#br
#br
''図2:作品全体の表示''
#ref(browser.png)
#br
#br
-以下の情報は,ブラウザ表示の際にカーソルを合わせると上図...
--傍点・傍線・強調
--上付き・下付き
--ぶら下げ・字下げ・地付き
-底本情報を含む書誌情報(元の XHTML タグで <div class="bi...
※詳細な検索方法は,全文検索システム『ひまわり』の[[マニュ...
*謝辞 [#v3c1b1ff]
-『インターネット図書館青空文庫』の著者である野口英二氏,...
-本パッケージは,[[『博報「ことばと文化・教育」研究助成』...
ページ名: