1.『ひまわり』とは †
『ひまわり』は,言語研究用に設計された全文検索システムです。XML 文書から特定の文字列を高速に検索することができます。
『ひまわり』の主な機能は,次のとおりです。
- XML 文書に対する高速な全文検索機能
- 検索対象の資料を XML 文書として記述すれば,さまざまな資料を検索対象とすることができます。現在,『ひまわり』で検索できる資料の例を次に挙げます。
- 『太陽コーパス』
- 『日本語話し言葉コーパス』(CSJ)
- 『分類語彙表』
- XML 文書の要素,属性を検索条件として指定することができます。
- インデックス(Suffix Array 方式)を利用して,高速な全文検索を実現しています。
- 言語研究支援機能
- 検索結果を KWIC (Key Word In Context) の形式で表示することができます。
- XML 文書の要素や属性として付与されたさまざまな情報を,資料に適した形で閲覧することができます。例えば,書誌情報,引用情報,著者情報などの付与情報を参照することができます。