第7回コーパス利用講習会
(全文検索システム『ひまわり』講習会)
2019-06-14
山口昌也(国語研究所)
講習会の概要 †
- 日時:2019年7月27日(土)13:30-16:00
- 場所:国立国語研究所
- 主催:
- 国立国語研究所共同研究プロジェクト「大規模日常会話コーパスに基づく話し言葉の多角的研究」
- JSPS科研費「「昭和話し言葉コーパス」の構築による話し言葉の経年変化に関する実証的研究」
- 定員:5名程度
- 内容:既存資料(テキストデータ)を全文検索システム『ひまわり』で活用することを目的として,以下の方法を学びます。今回は,検索などの各種機能の操作手順を説明するものではなく,実際に『ひまわり』用資料を作成する,ワークショップ型の講習を予定しています。
- 研究用情報の人手タグ付け
- 形態素解析システムによる解析結果のタグ付け
- 『ひまわり』へのインポート
- 『ひまわり』用資料としてのパッケージ化
- 参加の要件:
- 自分で作成した言語研究用の資料などの既存資料(テキストデータ)を『ひまわり』で利用したい方
- テキストエディタ(秀丸,サクラエディタなど)を扱えること
- 正規表現を扱えること
- ノートPCを持参できること(Windows, macOS, Linux)
事前準備 †
1. 概要 †
- インストール先の PC の OSは,Windows7以降を想定しています。これ以外のOSを利用している方は,事前にご相談ください。
- インストールには,約##MB を必要とします。ハードディスクの残り容量を確認して下さい。
- 以下の作業は,講習会当日使用するPCをインターネットに接続して,行なって下さい。
- ご不明な点があれば,
までご連絡下さい。
2.『ひまわり』のインストール †
- 『ひまわり』(ver.1.6ls04) を国語研のサイトからダウンロードして下さい。
- himawari_1_6ls05.zip を展開(解凍)し,Himawari_1_6ls05 というフォルダ(以後,『ひまわり』フォルダ)があることを確認して下さい。
- 『ひまわり』フォルダを,デスクトップなど操作しやすい場所に移動して下さい。
- 『ひまわり』フォルダの中の himawari.exe をダブルクリックしてください。Windows の設定によっては,himawari とだけしか表示されない場合もあります。このアイコン
を目印にしてください。
- 『ひまわり』が起動すれば,インストールは完了です。