全文検索システム『ひまわり』


 『ひまわり』は,言語研究用に設計された全文検索システムです。

 このリリースノートでは,『ひまわり』ver.1.5 で追加された機能,ダウンロードの方法,ver.1.3 からの移行方法について説明します。


目次

1.ver.1.5 の開発方針

 ver.1.5 では,次の開発方針を掲げて,機能を強化しました。

  • 『ひまわり』用データ作成の簡易化
  • 『ひまわり』用データへのアノテーションの実現

2.追加された機能

2.1 テキストインポート機能

  • 『えだまめ』の機能の実装
  • 『えだまめ』の機能の拡張
    • 文字正規化(半角・全角変換など)
    • パターンマッチによるテキスト変換(XMLタグ化など)

2.2 アノテーション機能

2.3 その他

  • 検索結果の統計機能の強化(マウスで指定した列の結果の頻度を集計できるようになりました)
  • 検索結果のフィルタ機能の強化(マウスで指定した列の値で検索結果をフィルタリングできるようになりました)
  • 言語資料の閲覧機能の強化

3.利用イメージ

  1. 電子化された資料を作成,または,収集します。
  2. 作成した資料を『ひまわり』にインポートします(「テキストインポート機能」)。
  3. 形態素解析システムで言語資料を解析して,その結果を言語資料にアノテーションします(「外部プログラムによるアノテーション機能」)。
  4. インポートした言語資料を検索します。この際,アノテーション結果を表示したり,検索条件とすることができます。
  5. 検索結果に対して,研究用の情報を人手でアノテーションします(人手アノテーション機能)。このアノテーション結果も検索で利用できます。

4.ver.1.3 からの移行

 ver.1.3 用に作成された言語資料は,そのまま ver.1.5 でも利用することができます。ただし,逆は不可です。


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2014-02-21 (金) 00:00:00 (2010d)