言語データベースとソフトウェア
『ひまわり』とは
『ひまわり』は,言語研究用に設計された全文検索システムで,次の機能を持っています。
- XML 文書から特定の文字列を高速に全文検索する機能 (Unicode に対応)
- 検索結果の KWIC (KeyWord In Context) 表示,および,資料に適した形で閲覧する機能
『ひまわり』を使うことにより,『太陽コーパス』,『日本語話し言葉コーパス』,『分類語彙表』などの既存の言語資料や,自分で作成した XML 文書を検索することができるようになります。なお,『ひまわり』は Java 言語で記述されており,Windows, Linux, Mac OS X などさまざまな OS 上で動作します。
お知らせ: ver.1.3β03 をリリースしました(2009-07-07)。
『太陽コーパス』への適用例
(画像をクリックすると大きくなります。)
ダウンロード
- 『ひまわり』
- ver.1.3β03 () ... 開発版
- ver.1.2.1 () ... 安定版
- Windows, Linux, Mac OS X 上で動作します。ただし,同梱されているファイルが古いため,できるだけ,ver.1.3β03 を利用することをおすすめします。特に,WindowsVista で正常に動作しない可能性があります。
- テスト検索用の言語資料として,『太陽コーパス』サンプル と 『分類語彙表』サンプル が同梱されています。
- 言語資料(他の機関・個人の方々が公開している資料へのリンク)
文書
使用上の注意とお願い
- 『ひまわり』を使用したことにより生じるいかなる損害についても,独立行政法人国立国語研究所は賠償する責任を負いません。そのことをご承知の上,『ひまわり』をご使用ください。
- 『ひまわり』に対するご意見,不具合のご報告などは,
までお寄せください。また,各ソフトウェアのダウンロードのページでは,アンケートをご用意しています。いただいたご意見,ご報告に対して,お返事することはお約束できませんが,今後の改良に役立てさせていただきますので,ぜひアンケートにお答えください。
関連リンク