本ページは作成中です。
[ツール]⇒[一覧]⇒[ユーザ入力]で,言語資料に付与されているアノテーション内容の集計を行います。
アノテーションは,タグによって記述されているため,タグを指定して集計することになります。例えば,『青空文庫』サンプルでは,一つの作品に対して,「記事」というタグが付与されています。タグはいくつかの属性を持つことができ,「記事」には作品名や著者名の属性があります。
『青空文庫』サンプルの「記事」タグを使って,作品一覧を作成する手順は,次のとおりです。
「頻度」オプションをチェックすると,一覧の各項目の出現頻度を計測することができます。下の図は,「記事」の頻度を表示したものです。『青空文庫』サンプルには,作品は重複して登録されていないため,当然,各作品の頻度は1になります。
同様に,rタグ(ルビ)に対して,実行したのが次の図です。左図はrタグの属性rtを選択して表示したものです。rt属性には,ルビ本体が記述されているので,頻度付きのルビの一覧を作成することができます。
一方,右図は属性を選択しないで表示したものです。この場合,rタグの総数を計測することになります。
タグは,「第1層タグ」「第2層タグ」「第3層タグ」に複数指定することにより,タグ間の包含関係を考慮した一覧の作成が可能です。下の図は,「第1層タグ」に「記事」タグ,「第2層タグ」にrタグを指定することにより,「記事」に含まれるルビの数を計測しています。
「頻度」は最下層のタグを対象に計測します。上の例の場合は,rタグの頻度を「記事」ごとに計測することになります。
「長さ」オプションは,タグでマークアップされている文字列の長さを計測します。次の例は,「記事」タグでマークアップされている文字列(『青空文庫』サンプルの場合は一つの作品)に含まれる文字数を計測することになります。