[[『たんぽぽ』,『プリズム』]] *『たんぽぽ』 [#tanpopo] #ref(tanphoto.jpg,right,around) 『たんぽぽ』は[[「雑誌コーパスXML文書」>../雑誌コーパスの文書定義]]を直接検索するためのツールです。 Internet Explorer 6以降がインストールされたWindows環境で動作します。 雑誌コーパスXML文書は[[『太陽コーパス』>http://www.kokken.go.jp/lrc/index.php?%C2%C0%CD%DB%A5%B3%A1%BC%A5%D1%A5%B9]]で採用されている形式です。詳しくは[[雑誌コーパスの文書定義>../雑誌コーパスの文書定義]]をご覧ください。 『たんぽぽ』にはサンプルとして次の記事のXMLファイルを同梱しています。 >川上眉山「黄昏」『太陽』1901年04号,pp.81-90 #clear **著作権 [#license] +『たんぽぽ』の著作権は,独立行政法人 国立国語研究所が保持します。 +本ページでは,GPL ライセンスに基づいて,このパッケージを配布しています。 GPLライセンスについてはリンク先(http://www.gnu.org/licenses/gpl.ja.html)をご覧ください。 **ダウンロード [#download] 次のファイルをダウンロードしてください。lzh形式で圧縮されています。 -&ref(Tanpopo2a.lzh); 雑誌コーパスXML本文検索ツール『たんぽぽ』2.0a(サンプル記事付き) *使い方 [#howto] ※以下の説明画面では,本パッケージには同梱されていないXML文書(『女学雑誌』1894年刊)を使用しています。『女学雑誌』のXML文書は日本学術振興会科学研究費の助成を受け,国立国語研究所で作成中のもので,2006年に公開予定です。 ※以下の説明画面では,本パッケージには同梱されていないXML文書(『女学雑誌』1894年刊)を使用しています。『女学雑誌』のXML文書は[[『近代女性雑誌コーパス』>http://www.kokken.go.jp/lrc/index.php?%B6%E1%C2%E5%BD%F7%C0%AD%BB%A8%BB%EF%A5%B3%A1%BC%A5%D1%A5%B9]]の一部です。詳しくは[[リンク先>http://www.kokken.go.jp/lrc/index.php?%B6%E1%C2%E5%BD%F7%C0%AD%BB%A8%BB%EF%A5%B3%A1%BC%A5%D1%A5%B9]]をご覧ください。 **起動 [#start] ダウンロードしたファイルを展開し,中にあるTanpopo2.htaをダブルクリックしてください。 &ref(tanpopo.png); **利用手順 [#procedure] +画面左側に表示されているXMLファイルから検索対象のファイルを選ぶ --「Ctrl」キーまたは「Shift」キーを押しながらクリックすることで複数選択できます +検索文字列を入力する --検索文字列には正規表現が使えます --[字体変換]ボタンで入力済み文字列の字体を旧字体などに変換できます +必要に応じて「[[テキストの形式>#style]]」を選択する +[検索]ボタンを押す +見つかれば,検索結果が新しいウィンドウに表示されます --検索結果のウィンドウは複数開いておくことができます (操作方法が画面右下のメッセージ欄に表示されますので,指示に従ってください。また画面の「使い方」を押すと詳しい使い方が表示されます) &ref(tanpopo_result.png); ***テキストの形式・踊り字を開く [#style] -検索対象のテキストとして「ルビなしテキスト」「ルビ入りテキスト」「ルビを開いたテキスト」のいずれかを指定することができます。 -原文が「&ruby(ちよつと){一寸};&ruby(とお){通};りますよ」の場合,各形式は次のようになります。 |CENTER:テキストの形式|CENTER:検索対象となるテキスト|h |ルビなしテキスト|一寸通りますよ| |ルビ入りテキスト|一寸[ちよつと]通[とお]りますよ| |ルビを開いたテキスト|ちよつととおりますよ| -各形式での検索の例 --漢字で「一寸」と書かれた例すべて:ルビなしテキストで"一寸" --「一寸」に「ちよつと」とルビがついている例:ルビ入りテキストで"一寸[ちよつと]" --ひらがなで「ちよつと」と書かれた例すべて:ルビを開いたテキストで"ちよつと" -「踊字をひらく」オプションをオンにすると,テキスト中の踊字(くの字点やゝゞヽヾ等)を対応する文字に置き換えます(例:こゝろ→こころ)。「ルビを開いたテキスト」の場合にも有効です(&ruby(こゝろ){心};→こころ)。 **補足 [#add] -画面左側の「XMLファイル」には,雑誌コーパスXML文書以外のものが表示される場合があります(拡張子がXMLとなっているものがすべて表示されます)が,雑誌コーパスXML文書だけを検索対象として選択して下さい。 -『太陽コーパス』収録版とは次のような違いがあります。 --検索対象は画面左側の「XMLファイル」の中のファイル名で指定します。 --画面右側の[字体変換]機能が簡略化されています。 --検索結果が新しいウィンドウに開きます(そのため,複数の結果を一度に表示できます) --検索結果のうち,ヒットした文字列がある文(s)が太字で表示されます。 **更新履歴 [#history] |2006/05/10|不具合を修正し、Ver.2.0aとしました。| |2005/07/08|たんぽぽ Ver.2.0 公開| **利用イメージ[#ss] #ref(tanpopo_ss_small.png,nolink)