全文検索システム『ひまわり』講習会
「既存のテキストを『ひまわり』で検索してみよう」
2021-02-03
山口昌也(国語研究所)
講習会の概要 †
- 日時:2021年3月5日(金)13:30-16:00
- 場所:Zoom上で開催
- 定員:5名
- 講師:山口昌也
- 概要:全文検索システム『ひまわり』は,言語研究用に開発された全文検索システムです。本講習会では,既存のテキストデータを『ひまわり』にインポートする方法を学びます。今回は,次のことを実習形式で行う予定です。
- テキストデータを『ひまわり』にインポートする(青空文庫を予定)
- インポートするテキストデータにアノテーションする(人手,および,形態素解析システムMeCabによる)
- CSV形式のテキストデータをインポートする(『日本語諸方言コーパス』COJADASを予定)
- 共催:
- 国立国語研究所共同研究プロジェクト「大規模日常会話コーパスに基づく話し言葉の多角的研究」
- 東京外国語大学 大学院国際日本学研究院(NINJALユニット)
申込み方法 †
今回の講習会では,テキストデータを処理する場面がありますので,テキストエディタ(サクラエディタ,miエディタなど)を扱える方を対象とします。また,正規表現,および,『ひまわり』自体の使い方については,事前に学習しておくことを推奨します。
定員に達したため,『ひまわり』講習会の受講者募集は,終了しました。
チュートリアルビデオもご利用ください。