『たんぽぽ』,『プリズム』

『プリズム』

『プリズム』はXML文書をXSLTで手軽に変換するためのアプリケーションです。*1 Internet Explorer 6以降がインストールされたWindows環境で動作します。

配布パッケージには,雑誌コーパスXML文書を変換するためのXSLTスタイルシートと,サンプルとして次の記事のXMLファイルを同梱しています。

川上眉山「黄昏」『太陽』1901年04号,pp.81-90

著作権

  1. 『プリズム』および雑誌コーパスXML用スタイルシートの著作権は,独立行政法人国立国語研究所が保持します。
  2. 本ページでは,GPL ライセンスに基づいて,このパッケージを配布しています。 GPLライセンスについてはリンク先(http://www.gnu.org/licenses/gpl.ja.html)をご覧ください。

ダウンロード

『プリズム』と雑誌コーパスXML文書用XSLTスタイルシート,サンプルのXML文書をセットにしたパッケージです。

次のファイルをダウンロードしてください。lzh形式で圧縮されています。

使い方

※以下の説明画面では,本パッケージには同梱されていないXML文書(『女学雑誌』1894年刊)を使用しています。『女学雑誌』のXML文書は『近代女性雑誌コーパス』の一部です。詳しくはリンク先をご覧ください。

起動

ダウンロードしたファイルを展開し,中にあるPrism2.htaをダブルクリックして起動してください。
(必ずXSLTファイルがあるフォルダで起動してください。)

prism.png

利用手順

変換結果を画面表示する場合

変換結果を画面に表示する場合には次の手順で操作して下さい。

  1. 左側に表示されている,変換元となる「入力XMLファイル」を一つ選択する。
  2. 中央の「適用するスタイル」から,変換結果がHTMLになるものを一つ選択する。
  3. 右側の[変換(ブラウザで表示)]ボタンを押す。

変換結果をファイルに出力する場合

変換結果を表示するのではなく,ファイルに出力する場合には次の手順で行って下さい。

  1. 左側に表示されている,変換元となる「入力XMLファイル」を選択する。(「Ctrl」キーや「Shift」キーを押しながらクリックすることで複数選択できます)
  2. 中央の「適用するスタイル」を一つ選択する(どの形式でも可)。
  3. 適切な出力拡張子を選択し,必要に応じて出力フォルダ・出力ファイル名を変更する。(「入力XMLファイル」を複数選択した場合には出力ファイル名は変更できません)
  4. [変換(ファイルへ出力)]ボタンを押す。

(操作方法が画面上部のメッセージ欄に表示されますので,指示に従ってください。また,画面の「使い方」を押すと詳しい使い方が表示されます)

補足

  • 「入力XMLファイル」はCtrlキー(Shiftキー)を押しながらマウスを左クリックすることで複数選択できます。このとき[変換(ブラウザで表示)]は使えません。また出力ファイル名も拡張子以外は変更できません(既定の名前になります)。
  • 入力ファイルを複数選択したとき,「単一ファイルに追加出力」チェックボックスをチェックすると変換結果が一つのファイルに出力されます。CSVやテキスト形式のファイルなどに利用して下さい。
  • 出力がHTML形式でないものはブラウザでは正しく表示されませんのでファイル出力を行って下さい。このとき,適切な拡張子を選択してください。
  • ファイルに出力する場合には必ず書き込み可能なフォルダを指定して下さい(標準ではデスクトップが指定されます)。
  • 変換元ファイルにJIS外字がユニコードで入力されている場合,出力文字コードをShift_JISとして変換結果をファイルに出力すると,JIS外字が〓に置き換えられます。
  • 『太陽コーパス』収録版とは次のような違いがあります。
    • 変換結果を画面に表示する場合,変換を行うたびに次々と新しいウィンドウに表示されます。
    • 「単一ファイルに追加出力」する場合,すでに同名のファイルがあるときには,これを〜.bakという名前でバックアップした後,新しくファイルを出力します。

雑誌コーパスXML文書用XSLTスタイルシート

『プリズム』の配布パッケージには雑誌コーパスXML文書用の次のXSLTスタイルシートが同梱されています*2

形式変換Web閲覧用(HTML)本文−DHTMLtx2dhtm.xsl
本文−DHTML(行番号)tx2dhtm2.xsl
本文−シンプルなHTMLtx2html.xsl
テキスト(TXT)本文−プレーンテキストtx2text.xsl
本文−プレーンテキスト(行番号)tx2text2.xsl
印刷用(LaTeX)本文−pLaTeX本文tx2latex.xsl
本文−pLaTeX本文(行番号)tx2latex2.xsl
情報抽出Web閲覧用(HTML)外字一覧(コード順)HTMLhtm_gaiji.xsl
外字一覧(出現順)HTMLhtm_gaijic.xsl
記事情報HTMLhtm_note.xsl
注情報HTMLhtm_kiji.xsl
引用情報HTMLhtm_quot.xsl
表形式テキスト(CSV)記事情報CSVhtm_note.xsl
注情報CSVhtm_kiji.xsl
引用情報CSVhtm_quot.xsl
HTML変換用の共通書式(他のスタイルシートから呼び出す)html_mod.xsl

以上のファイルのほか,変換結果(HTML)のデザインを指定するzassi.cssが含まれています。

利用イメージ

prism_ss_small.png


*1 対応したスタイルシートを用意すれば雑誌コーパス以外のXML文書も変換できます。
*2 いずれのスタイルシートもXSLT 1.0に準拠しているので対応したXSLTプロセッサを用いればWindows以外の環境でも利用可能です。

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2010-01-18 (月) 00:00:00 (3563d)