CENTER:&size(20){話し言葉データ・『ひまわり』チュートリアル事前準備}; #br #br RIGHT:2016-06-09 RIGHT:山口昌也(国語研究所) #br #br * 1.概要 [#vb410cb3] - 本ページでは,チュートリアルで使うツール(全文検索システム『ひまわり』)とコーパスのインストールについて説明します。 - インストール先の PC の OSは,Windows7以降,もしくは,Mac OS X 10.7.3 以降を想定しています。 - インストールには,約2GB を必要とします。ハードディスクの残り容量を確認して下さい。 - 以下の作業は,チュートリアル当日使用するPCをインターネットに接続して,行なって下さい。 - ご不明な点があれば,山口までご連絡下さい。 * 2.『ひまわり』のインストール [#h36d4bfc] ** Windows の場合 [#ab8983f7] + 『ひまわり』(ver.1.5.4) を国語研のサイトからダウンロードして下さい。 -- [[himawari_1_5_4.zip>https://csd.ninjal.ac.jp/archives/Himawari/himawari_1_5_4.zip]] (約77MB) + himawari_1_5_4.zip を解凍し,Himawari_1_5_4 というフォルダ(以後,『ひまわり』フォルダ)があることを確認して下さい。 + 『ひまわり』フォルダを,デスクトップなど操作しやすい場所に移動して下さい。 + 『ひまわり』フォルダの中の himawari.exe をダブルクリックしてください。Windows の設定によっては,himawari とだけしか表示されない場合もあります。このアイコン&ref(./himawari_chan_64.png,40%);を目印にしてください。 #br #ref(./himawari_exe.png,80%,center) #br + 『ひまわり』が起動すれば,インストールは完了です。 //#br //#ref(./himawari_up.png,80%,center) ** Mac OS X の場合 [#t2bb4665] + [[Oracle のサイト>https://java.com/ja/download/]]から Java をダウンロードし,インストールして下さい。 + 『ひまわり』(ver.1.5.4) を国語研のサイトからダウンロードして下さい。 -- [[himawari_1_5_4.zip>https://csd.ninjal.ac.jp/archives/Himawari/himawari_1_5_4.zip]] (約77MB) + himawari_1_5_4.zip を解凍し,Himawari_1_5_4 というフォルダ(以後,『ひまわり』フォルダ)があることを確認して下さい。 + 『ひまわり』フォルダを,デスクトップなど操作しやすい場所に移動して下さい。 + 『ひまわり』を起動してみます。 -- 『ひまわり』フォルダの中の himawari.jar を探して下さい。 -- 初回実行時は,セキュリティ上の警告がでるため,himawari.jar を右クリック(副ボタンをクリック)し,ポップアップメニューから「開く」を選択して下さい。 -- 以降は,himawari.jar をダブルクリックすれば,『ひまわり』が起動します。 + 『ひまわり』が起動すれば,インストールは完了です。 * 3.コーパスのインストール [#r50e93c7] ** コーパスのダウンロード [#qa50c46a] 以下のコーパスをダウンロードして下さい。一般公開していないコーパスは,ダウンロード時に認証が必要です。別途送付するユーザ名とパスワードを入力して下さい。なお,ネットワーク速度の問題などで,ダウンロードが難しい場合は,事前にご連絡下さい。 - 一般に公開していないコーパス(&color(red){取り扱い注意。プロジェクト内での利用に限定};) -- [[名大会話コーパス>https://csd.ninjal.ac.jp/archives/Private/himawari_meidai_20160610.zip]] (約76MB) -- [[女性のことば(職場編)>https://csd.ninjal.ac.jp/archives/Private/himawari_josei_20160610.zip]] (約6MB) -- [[男性のことば(職場編)>https://csd.ninjal.ac.jp/archives/Private/himawari_dansei_20160610.zip]] (約7MB) - 公開済みコーパス(利用条件などは,個々のホームページ参照) -- [[日本語話し言葉コーパス(サンプル)>http://csd.ninjal.ac.jp/archives/Himawari/himawari_csj_sample_20150414.zip]] (約0.4MB,[[ホームページ>http://www2.ninjal.ac.jp/lrc/index.php?%C1%B4%CA%B8%B8%A1%BA%F7%A5%B7%A5%B9%A5%C6%A5%E0%A1%D8%A4%D2%A4%DE%A4%EF%A4%EA%A1%D9%2F%A5%C0%A5%A6%A5%F3%A5%ED%A1%BC%A5%C9%2FCSJ%A5%B5%A5%F3%A5%D7%A5%EB%A5%C7%A1%BC%A5%BF]]) -- [[国会会議録(本会議)>http://csd.ninjal.ac.jp/archives/Kokkai/kokkaiHimawari_honkaigi_rev20160525.zip]](約592MB,[[ホームページ>http://www2.ninjal.ac.jp/lrc/index.php?%C1%B4%CA%B8%B8%A1%BA%F7%A5%B7%A5%B9%A5%C6%A5%E0%A1%D8%A4%D2%A4%DE%A4%EF%A4%EA%A1%D9%2F%A5%C0%A5%A6%A5%F3%A5%ED%A1%BC%A5%C9%2F%A1%D8%B9%F1%B2%F1%B2%F1%B5%C4%CF%BF%A1%D9%A5%D1%A5%C3%A5%B1%A1%BC%A5%B8]],別に「予算委員会」もあり) ** インストールの実行 [#wa1d544e] コーパスのインストールは,『ひまわり』を起動し,ダンロードしたファイルを『ひまわり』にドラッグ&ドロップしてください(&color(red){解凍する必要はありません};)。しばらくして,「インストールが終了しました」と出れば,インストールは終了です(&color(red){「国会会議録」};は他のコーパスより時間がかかります)。上記の五つのコーパスのインストールを完了させておいて下さい。 #br #ref(./install.png,60%,center)