第7回コーパス利用講習会
(全文検索システム『ひまわり』講習会)
2019-06-14
山口昌也(国語研究所)
講習会の概要 †
- 日時:2019年7月27日(土)13:30-16:00
- 場所:国立国語研究所
- 主催:
- 国立国語研究所共同研究プロジェクト「大規模日常会話コーパスに基づく話し言葉の多角的研究」
- JSPS科研費「「昭和話し言葉コーパス」の構築による話し言葉の経年変化に関する実証的研究」
- 定員:5名程度
- 内容:既存資料(テキストデータ)を全文検索システム『ひまわり』で活用することを目的として,以下の方法を学びます。今回は,検索などの各種機能の操作手順を説明するものではなく,実際に『ひまわり』用資料を作成する,ワークショップ型の講習を予定しています。
- 研究用情報の人手タグ付け
- 形態素解析システムによる解析結果のタグ付け
- 『ひまわり』へのインポート
- 『ひまわり』用資料としてのパッケージ化
- 参加の要件:
- 自分で作成した言語研究用の資料などの既存資料(テキストデータ)を『ひまわり』で利用したい方
- テキストエディタ(秀丸,サクラエディタなど)を扱えること
- 正規表現を扱えること
- ノートPCを持参できること(Windows, macOS, Linux)
事前準備 †
1.概要 †
- インストール先の PC の OSは,Windows7以降,macOS を想定しています。これ以外のOSを利用している方は,事前にご相談ください。
- インストールには,約##MB を必要とします。ハードディスクの残り容量を確認して下さい。
- 以下の作業は,講習会当日使用するPCをインターネットに接続して,行なって下さい。
- ご不明な点があれば,担当者までご連絡下さい。
2.Windows の場合 †
2.1『ひまわり』のインストール †
- 『ひまわり』(ver.1.6ls04) を国語研のサイトからダウンロードして下さい。
- himawari_1_6ls05.zip を展開(解凍)し,Himawari_1_6ls05 というフォルダ(以後,『ひまわり』フォルダ)があることを確認して下さい。
- 『ひまわり』フォルダを,デスクトップなど操作しやすい場所に移動して下さい。
- 『ひまわり』フォルダの中の himawari.exe をダブルクリックしてください。Windows の設定によっては,himawari とだけしか表示されない場合もあります。このアイコン
を目印にしてください。
- 『ひまわり』が起動すれば,インストールは完了です。
2.2 MeCabのインストール †
- MeCab の配布サイトから,Binary package for MS-Windowsをダウンロード
- ダウンロードしたファイルをダブルクリックし,MeCab をインストール
- インストール時の選択オプションは,すべてデフォルトでかまいません。
2.3 サクラエディタのインストール †
常用のテキストエディタがあれば,当日使用してもかまいませんが,念のため,サクラエディタをインストールしておいてください。
- サクラエディタの配布サイトから ver.2.2.0.1をダウンロード
- ダウンロードしたファイルをダブルクリックして,インストールして下さい。
3.macOSの場合 †
3.1『ひまわり』のインストール †
- Java配布サイト(AdoptOpenJDK)から Java をダウンロードし,インストールして下さい。画面下方に,青色で「Install JRE installer」とあるところをクリックします。
- 『ひまわり』(講習会用) を国語研のサイトからダウンロードして下さい。
- himawari_1_6ls05.zip を展開(解凍)し,Himawari_1_6ls05 というフォルダ(以後,『ひまわり』フォルダ)があることを確認して下さい。
- 『ひまわり』フォルダを,デスクトップなど操作しやすい場所に移動して下さい。
- 『ひまわり』を起動してみます。
- 『ひまわり』フォルダの中の himawari.jar を探して下さい。
- 初回実行時は,セキュリティ上の警告がでるため,himawari.jar を右クリック(副ボタンをクリック)し,ポップアップメニューから「開く」を選択して下さい。
- 以降は,himawari.jar をダブルクリックすれば,『ひまわり』が起動します。
- 『ひまわり』が起動すれば,インストールは完了です。
3.2 brew のインストール(MeCab のインストールに必要) †
- インターネットに接続していることを確認
- 「ターミナル」を起動
- [アプリケーション]⇒[ユーティリティ]⇒「ターミナル」
- 次のコマンドをコピーし,ターミナルにペースト([編集]⇒[ペースト])してください。リターンキーを押すと,コマンドが実行されます。
/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
- "Press RETURN to continue or any other key to abort" と表示されるので,リターンキーを押してください。
- "Password:" と表示されるので,管理者用のパスワードを入力して下さい。
- 少し待つと,"Installation successful!", "Next steps:" などと表示されて,brew のインストールが終了します。
3.3 MeCab のインストール †
- インターネットに接続していることを確認
- 次のコマンドをコピーし,ターミナルにペーストしてください。リターンキーを押すと,MeCabとipadicがインストールされます。なお,UniDicは himawari_1_6b06ls3.zipに同梱されています。
brew install mecab mecab-ipadic
- 次のコマンドをコピーし,ターミナルにペーストしてください。リターンキーを押して,"mecab of 0.996" と表示されれば,MeCabのインストールは完了です。
mecab --version
2.3 サクラエディタのインストール †