#author("2020-08-24T08:13:56+00:00","default:rd","rd") [[全文検索システム『ひまわり』]] //&size(20){&color(red){本ページは現在構築中です};}; RIGHT:作成者:山口昌也 (国立国語研究所) RIGHT:2020-08-24 #br * 1.概要 [#x0562e5e] このページでは,[[I-JAS>https://chunagon.ninjal.ac.jp/static/ijas/about.html]]のプレインテキストを『ひまわり』で利用する方法について説明します。 * 2.準備 [#a003392e] + [[I-JASのホームページ>https://chunagon.ninjal.ac.jp/static/ijas/about.html]]を参考に中納言のユーザ登録とI-JASの利用申請をしてください。 -- 中納言にログインすると,コーパス一覧のI-JASの備考欄に「テータ配布」へのリンク先からデータをダウンロードしてください。 --- 「対面調査(プレインテキスト)」「非対面調査(プレインテキスト)」の2種類があります。 --- 上記のリンク先のページに,CCH.zip のように圧縮してあるファイルがありますので,それをダウンロードしてください。 *3 『ひまわり』へのインポート [#b9bea5af] //** 3.1 方法1(手軽な方法) [#d419966b] この方法は,『ひまわり』のインポート機能をデフォルト設定で利用するだけの簡単な方法です。 + 2の準備でダウンロードした,zipファイルを展開してください。 + 『ひまわり』を起動し,展開したフォルダを『ひまわり』にドラッグ&ドロップしてください。 -- 複数のzipファイルのデータをまとめて検索したい場合は,展開してフォルダを一つのフォルダにまとめて,トップのフォルダを『ひまわり』にドラッグ&ドロップしてください。 -- トップのフォルダ |-- CCH |-- CCM --- EAU + 「テキストデータインポート」というタイトルのウィンドウが現れますので,「インポート」ボタンを押してください。 + 以上で終了です。 -- [[ビデオチュートリアル>全文検索システム『ひまわり』/ビデオチュートリアル]]の[[インポート(基礎編)>https://youtu.be/Z6N5pwd4UVU]]も参考にしてください。 -- 単語検索したい場合は,[[インポート(応用編)>https://youtu.be/wU2_YLs4sig]]を参考にしてください。なお,チュートリアルのページでは,形態素解析システムMeCabのインストールの方法も説明しています。 なお,この方法では,話者のIDも検索対象になってしまいますので注意してください。 //。方法2では,話者のIDなどテキストの構造を考慮しつつ,インポートする方法を説明する予定です。 //** 3.2 方法2(テキスト変換などを行う方法) [#p4c03145] //&size(20){&color(red){この方法は現在作成中です};};