全文検索システム『ひまわり』/ダウンロード/『ひまわり』ver.1.6/リリースノート

外部アノテーション結果の閲覧例

  1. 起動している『ひまわり』に config_aozora_sample.sd.xml をドラッグ&ドロップします。[ファイル]⇒[新規]で指定しても同じことができます。
  2. 適当な文字列を検索します。
  3. 閲覧したい行を選択し,Shift キーを押しながら,ダブルクリックします。
browse_morph.png

外部アノテーション(形態素解析)の実行

  1. MeCabかJumanをインストールします。
  2. 適当なフォルダに『ひまわり』にインポートしたいテキストファイルを用意します。なお,フォルダ名がコーパス名になります。
  3. 起動している『ひまわり』にフォルダをドラッグ&ドロップします。
  4. 詳細オプションを選択し,「形態素解析」オプションで,MeCabかJumanを選択します。
     
    import1.png
     
  5. 「インポート」ボタンを押すと,インポートの処理が始まり,問題なくインポートできた場合は,そのまま検索できるようになります。
  6. インポートしたコーパスの設定ファイルは,config_コーパス名.xml と config_コーパス名.sd.xml です。後者が形態素解析結果付きの検索用の設定ファイルです。
     
    import2.png
     

一覧内容の指定

  1. 起動している『ひまわり』に config_aozora_sample.sd.xml をドラッグ&ドロップします。[ファイル]⇒[新規]で指定しても同じことができます。
  2. [ツール]⇒[一覧]⇒[直接入力]を実行します。
  3. 閲覧したい要素を指定します。ここでは,形態素(morph)の一覧を表示してみます。
    1. 「上位タグ」で「morph」を選択します。
       
      list1.png
       
    2. 「morph」に付与されている属性を選択します。
       
      list2.png
       
    3. 「頻度」にチェックを入れます。
    4. 「OK」を押すと,『青空文庫』サンプルに含まれる形態素の一覧を表示することができます。また,ステータスバーの部分に,延べと異なり数が表示されます。
       
      list3.png
       

文脈オプションの追加

  1. 起動している『ひまわり』に config_aozora_sample.sd.xml をドラッグ&ドロップします。[ファイル]⇒[新規]で指定しても同じことができます。
  2. [ツール]⇒[一覧]⇒[直接入力]を実行します。
  3. 閲覧したい要素と文脈オプションを指定します。ここでは,形態素(morph)のbigramを作成します。
    1. 「第1階層タグ」で「morph」を選択します。また,文脈オプションを1にし,さらに,頻度オプションをチェックします。なお,文脈オプションを2にすれば,trigramを求めることになります。 にチェックを入れます。
       
      list_settings1.png
       
    2. 「morph」に付与されている属性として,「基本形」「品詞」を選択します。
       
      attributes2.png
       
    3. 「OK」を押すと,bigramが表示されます。
       
      bigram.png
       

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2017-03-15 (水) 00:00:00 (889d)