第7回コーパス利用講習会
(全文検索システム『ひまわり』講習会)
 
 
2019-06-14
山口昌也(国語研究所)
 
 

講習会の概要

  • 日時:2019年7月27日(土)13:30-16:00
  • 場所:国立国語研究所
  • 主催:
    • 国立国語研究所共同研究プロジェクト「大規模日常会話コーパスに基づく話し言葉の多角的研究」
    • JSPS科研費「「昭和話し言葉コーパス」の構築による話し言葉の経年変化に関する実証的研究」
  • 定員:5名程度
  • 内容:既存資料(テキストデータ)を全文検索システム『ひまわり』で活用することを目的として,以下の方法を学びます。今回は,検索などの各種機能の操作手順を説明するものではなく,実際に『ひまわり』用資料を作成する,ワークショップ型の講習を予定しています。
    • 研究用情報の人手タグ付け
    • 形態素解析システムによる解析結果のタグ付け
    • 『ひまわり』へのインポート
    • 『ひまわり』用資料としてのパッケージ化
  • 参加の要件:
    • 自分で作成した言語研究用の資料などの既存資料(テキストデータ)を『ひまわり』で利用したい方
    • テキストエディタ(秀丸,サクラエディタなど)を扱えること
    • 正規表現を扱えること
    • ノートPCを持参できること(Windows, macOS, Linux)

事前準備

1.概要

  • インストール先の PC の OSは,Windows7以降,macOS を想定しています。これ以外のOSを利用している方は,事前にご相談ください。
  • インストールには,約3GB を必要とします。ハードディスクの残り容量を確認して下さい。
  • 以下の作業は,講習会当日使用するPCをインターネットに接続して,行なって下さい。
  • ご不明な点があれば,担当者までご連絡下さい。

2.Windows の場合

2.1『ひまわり』のインストール

  1. 『ひまわり』(ver.1.6ls05) を国語研のサイトからダウンロードして下さい。
  2. himawari_1_6ls05.zip を展開(解凍)し,Himawari_1_6ls05 というフォルダ(以後,『ひまわり』フォルダ)があることを確認して下さい。
  3. 『ひまわり』フォルダを,デスクトップなど操作しやすい場所に移動して下さい。
  4. 『ひまわり』フォルダの中の himawari.exe をダブルクリックしてください。
    • Windows の設定によっては,himawari とだけしか表示されない場合もあります。このアイコンhimawari_chan_64.pngを目印にしてください。
    • なお,32ビット版のWindowsを使用している場合,himawari.exe を実行すると,エラーがでます。himawari32.exe を利用してください。
       
      center
       
  5. 『ひまわり』が起動すれば,インストールは完了です。

2.2 MeCabのインストール

  1. MeCab の配布サイトから,Binary package for MS-Windowsをダウンロード
  2. ダウンロードしたファイルをダブルクリックし,MeCab をインストール
    • インストール時の選択オプションは,すべてデフォルトでかまいません。

2.3 サクラエディタのインストール

 常用のテキストエディタがあれば,当日使用してもかまいませんが,念のため,サクラエディタをインストールしておいてください。なお,サクラエディタの代わりに,秀丸でもOKです。

  1. サクラエディタの配布サイトから ver.2.2.0.1をダウンロード
  2. ダウンロードしたファイルをダブルクリックして,インストールして下さい。
 
Windowsの場合は,以上で事前準備は終了です。
 
 

3.macOSの場合

3.1『ひまわり』のインストール

  1. Java配布サイト(AdoptOpenJDK)から Java をダウンロードし,インストールして下さい。画面下方に,青色で「Install JRE installer」とあるところをクリックします。
  2. 『ひまわり』(講習会用) を国語研のサイトからダウンロードして下さい。
  3. himawari_1_6ls05.zip を展開(解凍)し,Himawari_1_6ls05 というフォルダ(以後,『ひまわり』フォルダ)があることを確認して下さい。
  4. 『ひまわり』フォルダを,デスクトップなど操作しやすい場所に移動して下さい。
  5. 『ひまわり』を起動してみます。
    • 『ひまわり』フォルダの中の himawari.jar を探して下さい。
    • 初回実行時は,セキュリティ上の警告がでるため,himawari.jar を右クリック(副ボタンをクリック)し,ポップアップメニューから「開く」を選択して下さい。
    • 以降は,himawari.jar をダブルクリックすれば,『ひまわり』が起動します。
  6. 『ひまわり』が起動すれば,インストールは完了です。

3.2 brew のインストール(MeCab のインストールに必要)

  1. インターネットに接続していることを確認
  2. 「ターミナル」を起動
    • [アプリケーション]⇒[ユーティリティ]⇒「ターミナル」
  3. 次のコマンドをコピーし,ターミナルにペースト([編集]⇒[ペースト])してください。リターンキーを押すと,コマンドが実行されます。
    /usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
  4. "Press RETURN to continue or any other key to abort" と表示されるので,リターンキーを押してください。
  5. "Password:" と表示されるので,管理者用のパスワードを入力して下さい。
  6. 少し待つと,"Installation successful!", "Next steps:" などと表示されて,brew のインストールが終了します。

3.3 MeCab のインストール

  1. インターネットに接続していることを確認
  2. 次のコマンドをコピーし,ターミナルにペーストしてください。リターンキーを押すと,MeCabとipadicがインストールされます。なお,UniDicは himawari_1_6b06ls05.zipに同梱されています。
    brew install mecab mecab-ipadic
  3. 次のコマンドをコピーし,ターミナルにペーストしてください。リターンキーを押して,"mecab of 0.996" と表示されれば,MeCabのインストールは完了です。
    mecab --version

3.4 テキストエディタ mi のインストール

 常用のテキストエディタがあれば,当日使用してもかまいませんが,念のため,miをインストールしておいてください。

  1. mi の配布サイトから ver.3.0.3r1 (最新バージョン)をダウンロード
  2. ダウンロードしたファイルをダブルクリックして,インストールして下さい。

添付ファイル: filehimawari_exe.png 18件 [詳細]

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2019-07-22 (月) 13:35:54 (33d)