[[全文検索システム『ひまわり』/青空文庫の文書を『ひまわり』で利用する方法2]]

*変換スクリプトの内容と定義 [#l66416cc]
**「青空文庫」変換スクリプトパッケージの内容 [#sa5fbab7]
-config_aozora.xml : 『ひまわり』設定ファイル
-Corporaフォルダ
--&color(darkorange){aozora.xml}; : コーパスファイル
--aozora.bat : 全てのバッチファイルを実行するバッチファイル
--copy_html.bat : CD-ROMからHTMLファイルをダウンロードするバッチファイル
--copy-pics.bat : CD-ROMから画像ファイルをダウンロードするバッチファイル
--xsl.bat : HTMLファイルをXMLファイルに変換するバッチファイル
--allinone.bat : 全てのファイルをまとめたコーパスファイルを作成し,文字コード・改行コードを調整するバッチファイル
--aozora.xsl : XHTMLファイルをXMLファイルに変換するXSLファイル
--xslt.js : XHTMLファイルをXMLファイルに変換するスクリプト
--head.xml : コーパスファイルの宣言とルートノード
--foot.xml : コーパスファイルのルートノードを閉じるタグ
--xsltフォルダ
---kotobun_written.xsl : 検索文字列が含まれる記事を表示するためのXSLファイル
---kotobun_written.css : 検索文字列が含まれる記事を表示するためのカスケードシート
---&color(darkorange){illustrationフォルダ}; : 画像ファイル
---&color(darkorange){gaijiフォルダ}; : 外字の画像ファイル
--&color(darkorange){xhtmlフォルダ}; : ダウンロードしたHTMLファイルを格納するフォルダ
--&color(darkorange){xmlフォルダ}; : 生成したXMLファイルを格納するフォルダ


※&color(darkorange){オレンジ色};で書かれたものは,変換スクリプト(aozora.bat)を実行することによって生成されるファイル・フォルダです。

**「青空文庫」変換スクリプト タグ定義 [#zf0a9a82]
-以下に「青空文庫」のXHTMLタグに対応するXMLタグを示しました。尚,全てのXHTMLタグをXML化したわけではありません。
-ここには「青空文庫」のXHTMLタグと対応しているもののみ載せました。全体の仕様は,以下のページと合わせてご覧ください。
--[[''共有データ形式/書き言葉''>../../共有データ形式/書き言葉]]
--[[''共有データ形式/書き言葉''>../../共有データ形式/書き言葉]] (準備中)

***タグリスト [#v235dfcf]
※以下 「青空文庫」XHTMLタグ : &color(darkgreen){Kotobun XMLタグ}; で示しました。
&br;※タグの分類はKotobunの仕様に合わせてあります。
-文書構造に関連するタグ 
--文書の構造
---<html> : &color(darkgreen){<記事 タイトル="&color(gray){作品名};" 著者="&color(gray){著者名};">};
---<body> : &color(darkgreen){<テキスト 種別="本文">};
---<div class="main_text"> : &color(darkgreen){<階層 種別="h1" タイトル="&color(gray){作品名};">};
--ヘッダ・フッタ
---<head> : &color(darkgreen){<ヘッダ>(内容は<!-- &color(gray){著作権情報}; -->「タイトル」「サブタイトル」「原題」「著者」「翻訳者」「編者」)};
---該当なし : &color(darkgreen){<フッタ>(内容は<ブロック 種別="書誌情報"> <ブロック 種別="表記について"> &color(gray){著作権情報};)};
--タイトル・著者等
---<h1 class="title"> : &color(darkgreen){<記事 タイトル="&color(gray){作品名};">/<タイトル>/ヘッダ内で「タイトル」として要素内容を表示};
---<h2 class="author"> : &color(darkgreen){<記事 著者="&color(gray){著者名};">/<著者>/ヘッダ内で「著者」として要素内容を表示};
---<h2 class="editor"> : &color(darkgreen){<著者>/ヘッダ内で「編者」として要素内容を表示};
---<h2 class="original_title"> : &color(darkgreen){<タイトル>/ヘッダ内で「原題」として要素内容を表示};
---<h2 class="subtitle"> : &color(darkgreen){<タイトル>/ヘッダ内で「サブタイトル」として要素内容を表示};
---<h2 class="translator"> : &color(darkgreen){<著者>/ヘッダ内で「翻訳者」として要素内容を表示};
--ブロック
---<div class="burasage"> : &color(darkgreen){<ブロック 種別="ぶら下げ">};
---<div class="chitsuki_&color(gray){0};" style="&color(gray){text-align:right; margin-right: 0em};"> : &color(darkgreen){<ブロック 種別="地付き" style="&color(gray){text-align:right; margin-right: 0em};">};
---<div class="jisage_&color(gray){3};" style="&color(gray){margin-left: 3em};"> : &color(darkgreen){<ブロック 種別="字下げ" style="&color(gray){jisage_3" style="margin-left: 3em};">};
---<div class="bibliographical_information"> : &color(darkgreen){<ブロック 種別="書誌情報">};
---<div class="notation_notes"> : &color(darkgreen){<ブロック 種別="表記について">};
-位置に関するタグ 
--<br> : &color(darkgreen){<b />};
-注記・校正に関するタグ
--<span class="notes">[#&color(gray){注記内容};]</span> : &color(darkgreen){<注 種別="注記" 付与="入力" 内容="[#&color(gray){注記内容};]"></注>};
--<span class="warichu"> : &color(darkgreen){<割書>};
-文字・表記に関するタグ 
--<ruby><rb>&color(gray){先刻};</rb><rp>&color(gray){(};</rp><rt>&color(gray){さっき};</rt><rp>&color(gray){)};</rp></ruby> : &color(darkgreen){<r rt="&color(gray){さっき};">&color(gray){先刻};</r>};
--<small> : &color(darkgreen){<小書>};
-その他のタグ 
--<b> : &color(darkgreen){<span 種別="強調">};
--<em class="&color(gray){underline_double};"> : &color(darkgreen){<span 種別="傍線" 備考="&color(gray){underline_double};">};
--<strong class="&color(gray){BLACK_CIRCLE};"> : &color(darkgreen){<span 種別="傍点" 備考="&color(gray){BLACK_CIRCLE};">};
--<sub> : &color(darkgreen){<span 種別="強調" 備考="下付き">};
--<sup> : &color(darkgreen){<span 種別="強調" 備考="上付き">};
-画像に関するタグ 
--<img gaiji="gaiji" src="&color(gray){ディレクトリ名・画像名};" alt="&color(gray){解字・文字コード};)" class="gaiji" /> : &color(darkgreen){<画像 src="&color(gray){ディレクトリ名・画像名};" alt="&color(gray){解字・文字コード};" 備考="gaiji">};
--<img class="illustration" width="&color(gray){画像幅};" height="&color(gray){画像高};" src="画像名" alt="画像の説明" /> : &color(darkgreen){<画像 src="&color(gray){ディレクトリ名・画像名};" alt="&color(gray){画像の説明};" height="&color(gray){画像幅};" width="&color(gray){画像高};" 備考="illustration"/>};

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS