[PukiWiki]

全文検索システム『ひまわり』/ビデオチュートリアル

Top/全文検索システム『ひまわり』/ビデオチュートリアル

全文検索システム『ひまわり』

YouTube チャンネル †

↑

『ひまわり』のインストール †

  • インストール(Windows)
  • インストール(macOS)
↑

各種パッケージ(言語資料)のインストール †

  • 『名大会話コーパス』の例
  • 『青空文庫』パッケージの例
↑

さまざまな機能 †

  • ソート
  • 絞り込み
  • 検索結果などの集計
  • 検索結果からの抽出(ランダム抽出,検索数制限など)
  • サブコーパス
↑

正規表現 †

  • 照合位置 ^ $
  • カタカナ,漢字,ひらがな文字列の抽出
↑

単語検索 †

  • 単語検索(パート1・名大会話コーパスの「出現形(短単位)」での検索) ... 高速ですが,限定的な正規表現での検索になります
  • 単語検索(パート2・名大会話コーパスの「全文(正規表現,短単位)」での検索) ... 通常の正規表現で検索できますが,パート1の方法よりも検索に時間がかかります
  • 単語検索(パート3・『青空文庫』パッケージの場合)
  • 単語検索(パート4・総単語数の計測) ... 『青空文庫』パッケージを例に,作品ごとの単語数を計測し,合算する形でパッケージに収録されている総単語数を求めます。
↑

テキストファイルのインポート †

  • [準備] 形態素解析システムMeCabのインストール
    • Windows
    • macOS
  • インポート(基礎編) ... 単にテキストファイルをインポートします。
  • インポート(応用編) ... インポート時に形態素解析を行う方法を示します。
  • 形態素解析時のMeCab+UniDicの利用
  • TED字幕テキストの利用
  • 日本語諸方言コーパス (COJADS)のCSVデータの利用

論文などで引用する際の
成果物の短縮URL

 

メニュー

  • コーパス
    • 『日本語話し言葉コーパス』
    • 『太陽コーパス』
    • 『近代女性雑誌コーパス』
       
  • 辞書関連
    • 形態素解析辞書『UniDic』
    • 語種辞書『かたりぐさ』
    • 『表記統合辞書』
    • 『分類語彙表増補改訂版』
       
  • 用例データベース
    • 複合動詞
    • サ変動詞
    • 形容詞
       
  • ソフトウェア
    • 全文検索システム『ひまわり』
    • 観察支援ツール FishWatchr
    • 観察支援ツール FishWatchr
      Mini
    • 作文支援システム TEachOtherS
    • 『ひまわり』支援ツール
    • 『たんぽぽ』,『プリズム』
       
  • 成果物の短縮URL
 
最新の10件
2021-01-15
  • 全文検索システム『ひまわり』/『ひまわり』で『日本語話し言葉コーパス』を利用する方法
2021-01-14
  • csj
  • 成果物の短縮URL
2020-12-24
  • 全文検索システム『ひまわり』/日本語諸方言コーパス (COJADS)のCSVデータの利用
  • 全文検索システム『ひまわり』/ビデオチュートリアル
2020-12-23
  • 全文検索システム『ひまわり』/TED字幕テキストの利用
2020-12-13
  • 全文検索システム『ひまわり』/ダウンロード/『ひまわり』ver.1.7
2020-12-12
  • 全文検索システム『ひまわり』/ダウンロード/『青空文庫』パッケージ
2020-12-05
  • MenuBar
2020-12-04
  • 全文検索システム『ひまわり』/履歴

total:2003
today:2
yesterday:6

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2020-12-24 (木) 17:35:06
Site admin: anonymous

PukiWiki 1.5.3 © 2001-2020 PukiWiki Development Team. Powered by PHP 7.2.34. HTML convert time: 0.009 sec.