pub/lesson20210305
全文検索システム『ひまわり』講習会 事前資料
2021-02-24
山口昌也(国語研究所)
1.概要 †
- 事前準備として,次のことを行ってください。
- ツールのインストール(『ひまわり』,MeCab,テキストエディタなど)
- 各種データの準備
- 準備を行う前に,次のことを確認してください。
- 事前準備は,講習会当日使用するPCをインターネットに接続して,行なって下さい。
- インストール先 PC の OSは,Windows,macOS を想定しています。これ以外のOSを利用することになった方は,事前にご相談ください。
- また,Windowsで言語設定を日本語以外にしていて,問題が出るようでしたら,言語設定を一時的に日本語にしてみてください。
- 当日は,Zoomでの開催になりますので,可能でしたら,別途Zoom用のPCやタブレットがあると受講しやすくなると思います(もちろん,なくても受講に支障がないようにします)。
- ご不明な点があれば,担当者までご連絡下さい。
当日配布資料(スライド,実習用データなど) †
2.ツールのインストール(Windows の場合) †
2.1『ひまわり』のインストール †
(チュートリアルビデオ)
- 『ひまわり』(ver.1.6.8) を国語研のサイトからダウンロードして下さい。
- himawari_1_6_8.zip を展開(解凍)し,Himawari_1_6_8 というフォルダ(以後,『ひまわり』フォルダ)があることを確認して下さい。
- 『ひまわり』フォルダを,デスクトップなど操作しやすい場所に移動して下さい。すでに『ひまわり』をインストールしている場合は,インストール済みの資料への影響を考慮し,講習会用の『ひまわり』を別途用意しておくことをおすすめします。
- 『ひまわり』フォルダの中の himawari.exe をダブルクリックしてください。
- Windows の設定によっては,himawari とだけしか表示されない場合もあります。このアイコン
を目印にしてください。
- なお,32ビット版のWindowsを使用している場合,himawari.exe を実行すると,エラーがでます。himawari32.exe を利用してください。
- 『ひまわり』が起動すれば,インストールは完了です。
2.2 MeCabのインストール †
(チュートリアルビデオ)
- MeCab の配布サイトから,Binary package for MS-Windowsをダウンロード
- ダウンロードしたファイルをダブルクリックし,MeCab をインストール
- インストール時の選択オプションは,すべてデフォルトでかまいません。
- デスクトップ上などにある MeCab のアイコンをダブルクリックして,MeCab を起動してください。黒いウィンドウが立ち上がるはずです。
- 漢字を含めた文字列を入力し,リターンキーを押してください。形態素解析されていれば,OK です。
2.3 サクラエディタのインストール †
サクラエディタをインストールしてください。なお,文字コード UTF-16 (Little Endian,BOM付き),改行コードLFでファイルを保存できるテキストエディタであれば,別のテキストエディタでもかまいませんが,念のため,サクラエディタもインストールしておくことをおすすめします。
- サクラエディタの配布サイトから ver.2.4.1をダウンロード
- ダウンロードしたファイルを展開(解凍)するとインストーラがありますので,ダブルクリックして,インストールして下さい。
3.ツールのインストール(macOSの場合) †
3.1『ひまわり』のインストール †
(チュートリアルビデオ)
- 『ひまわり』(ver.1.6.8) を国語研のサイトからダウンロードして下さい。
- ダウンロードしたファイルをダブルクリックして,インストールしてください。
- すでに,『ひまわり』をインストールしている場合は,既存の『ひまわり』に影響を与えるのを避けるため,新規にインストールしてください。その際,『ひまわり』を「Applications」フォルダではなく,デスクトップなどにドラッグ&ドロップしてください。
- 『ひまわり』が起動することを確認してください。
3.2 brew のインストール(MeCab のインストールに必要) †
(チュートリアルビデオ)
brewは,macOS用のソフトウェアパッケージの管理をするためのソフトウェアです。次の手順で,インストールしてください。
- インターネットに接続していることを確認
- 「ターミナル」を起動
- [アプリケーション]⇒[ユーティリティ]⇒「ターミナル」
- 次のコマンドをコピーし,ターミナルにペースト([編集]⇒[ペースト])してください。リターンキーを押すと,コマンドが実行されます。
/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
- "Press RETURN to continue or any other key to abort" と表示されるので,リターンキーを押してください。
- "Password:" と表示されるので,管理者用のパスワードを入力し,リターンキーを押してください(パスワードは表示されません)。
- 少し待つと(環境によっては10分程度),"Installation successful!", "Next steps:" などと表示されて,brew のインストールが終了します。
なお,本講習会後,brew をアンインストールする場合は,インストール時と同じように,ターミナルから次のコマンドを実行してください。brewとインストールしたパッケージが削除されます。
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/uninstall.sh)"
3.3 MeCab のインストール †
(チュートリアルビデオ)
- インターネットに接続していることを確認
- 次のコマンドをコピーし,ターミナルにペーストしてください。リターンキーを押すと,MeCabとipadicがインストールされます。
brew install mecab mecab-ipadic
- 次のコマンドをコピーし,ターミナルにペーストしてください。リターンキーを押して,"mecab of 0.996" と表示されれば,MeCabのインストールは完了です。
mecab --version
3.4 テキストエディタ mi のインストール †
mi をインストールしてください。なお,文字コード UTF-16 (Little Endian,BOM付き),改行コードLFでファイルを保存できるテキストエディタであれば,別のテキストエディタでもかまいませんが,念のため,miもインストールしておくことをおすすめします。
- mi の配布サイトから ver.3.5.1 (最新バージョン)をダウンロード
- ダウンロードしたファイルをダブルクリックして,インストールして下さい。
3.5 Firefox のインストール †
Firefoxをインストールしてください。
4.各種データの準備 †
4.1 『日本語話し言葉コーパス』サンプルデータのインストール †
次の手順で,『日本語話し言葉コーパス』サンプルデータをインストールしてください。
- 配布ページからパッケージをダウンロードしてください。
- 起動している『ひまわり』に,ダウンロードしたファイルをドラッグ&ドロップしてください。
- 「インストールが終了しました」と表示されれば,インストールは完了です。
その他 †