『たんぽぽ』,『プリズム』

『たんぽぽタガー』

小木曽智信・近藤明日子

概要

  • 『たんぽぽタガー』はふりがなや踊り字を展開した本文を検索して、付箋のようにXMLファイル中の当該部分に情報を書き込めるようにしたタグ付けツールです。
  • 詳細は次の文献をご覧ください。
    • 小木曽智信・近藤明日子 (2007)「日本語研究のためのXMLタグ付けプログラム−その開発と活用例−」『日本語科学』22号 pp.147-159.

利用条件

  • GPLで公開します。This script is distributed under GNU General Public License. (see http://www.gnu.org/licenses/gpl.html)
  • このプログラムを利用することによって直接的・間接的に生じたいかなる損害についても,作成者・著作権者は賠償する責任を負いません。

動作環境

  • Internet Explorer 6 以降がインストールされたWindows環境で利用できます。

ダウンロード

インストール

  1. ダウンロードしたファイルをダブルクリックして実行してください。(Windows Vistaでは右クリックして「管理者として実行」してください。)
  2. インストーラが起動しますので指示に従ってください。
  • アンインストールはコントロールパネルの「プログラムの追加と削除」から行ってください。

プログラムの起動

  • インストール完了後、スタートメニュー(「すべてのプログラム」>「たんぽぽタガー」)か、デスクトップ上のアイコンから起動してください。
  • スタートメニューの「たんぽぽタガー」>「使い方」、または画面の「使い方」ボタンで説明書が表示されます。

利用画面

たんぽぽタガー

tagger_small.png

太陽コーパスへのタグ付け例

tag.png

太陽コーパスに埋め込んだタグの表示例

(付属のkwic_htm.xslによる)

kwic.png

制限事項

付属スタイルシート

  • 付属のXSLTスタイルシートは雑誌コーパスに対応しています。その他のXML(XHTMLを含む。)を利用する場合には、対応したスタイルシートを別途用意する必要があります。 *1

雑誌コーパスXMLへのタグ付け

  • 踊り字展開機能は、踊り字タグの「くの字点」には対応していません。

XHTMLへのタグ付け

  • body以外の要素も含めて文字列は全てタグ付け対象になります。
  • 実体参照には対応していません。

*1 サンプルとして一般的なXML向けのスタイルシートをgeneral〜.xslという名前で同梱していますが、ファイルによってはうまく動作しない場合があります。

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2011-08-05 (金) 00:00:00 (2999d)