国語研究所の施設整備に伴い,関連のサービスを次の期間,停止します。
期間:2024年4月27日(土)9:00~2024年4月29日(月・祝)17:30
対象:Web用例データベース(複合動詞,サ変動詞,形容詞)・『ひまわり』&関連資料(ダウンロードもできません),FishWatchr & FishWatchr Miniなど
本ページは,現在構築中です。
目次
このページでは,『昭和話し言葉コーパス』 (以後,SSC) の全文検索『ひまわり』用パッケージSSCパッケージの利用方法を説明します。特徴は,次のとおりです。
なお,SSCパッケージは,SSCの配布データに含まれる転記テキスト,メタデータを『ひまわり』にインポートする形で構築しています。
パッケージのインストールが終了すると,SSCが検索できる状態になっています。検索できるかどうか,確認してください。検索するには,検索欄に適当な文字列を入力し,「検索」ボタンを押します。上の図は,「言葉」を検索した結果です。
検索結果の各列の説明は,次のとおりです。SSCのマニュアルもあわせて,参照して下さい。
列名 | 備考 |
---|---|
前文脈 | キーの前文脈 |
キー | 検索文字列 |
後文脈 | キーの後文脈 |
ファイルID | キーが出現したファイルのID |
話者ID | 当該発話の話者情報 |
氏名 | |
性別 | |
収録時年齢 | |
生年 | |
出身地 | |
居住地 | |
職業 | |
タイプ | 当該ファイルの情報 |
タイトル | |
録音年月 | |
開始時間 | 当該発話の開始時間 |
終了時間 | 当該発話の終了時間 |
品詞 | キーの先頭文字を含む語(短単位)の情報 |
活用型 | |
活用形 | |
語種 | |
語彙素 | |
語彙素読み | |
発音形出現形 | |
発音 | |
書字形 | |
タグ付き書字形 | |
語彙素-2 | 当該語の2語前の語彙素 |
語彙素-1 | 当該語の1語前の語彙素 |
語彙素1 | 当該語の1語後の語彙素 |
語彙素2 | 当該語の2語後の語彙素 |
Tier | 当該発話のTextGridデータにおける層 |
検索文字列欄の左のメニューから,検索対象を選択することができます。『ひまわり』利用者マニュアルの4.1 節もあわせてご覧ください。
検索例2a | 検索例2b | 検索例2c |
&ref(): File not found: "himawari_su1a.png" at page "全文検索システム『ひまわり』/『昭和話し言葉コーパス』"; | &ref(): File not found: "himawari_su2a.png" at page "全文検索システム『ひまわり』/『昭和話し言葉コーパス』"; | &ref(): File not found: "himawari_su3a.png" at page "全文検索システム『ひまわり』/『昭和話し言葉コーパス』"; |
&ref(): File not found: "himawari_file_db.png" at page "全文検索システム『ひまわり』/『昭和話し言葉コーパス』"; |
&ref(): File not found: "himawari_speaker_db.png" at page "全文検索システム『ひまわり』/『昭和話し言葉コーパス』"; |
検索結果(「ファイルID」「話者ID」「話者」「性別」「年齢」列を除く)をダブルクリックすると,当該の検索文字列を含んだ転記テキストを閲覧することができます。
タグ名 | 表示方法 |
読み | タグ付けされたテキストにルビとして表示 |
転訛 | タグ付けされたテキストにルビ(括弧つき)として表示 |
他話者,引用 | タグ付けされたテキスト強調表示(ボールド) |
咳,笑,板書 | タグを青色で表示 |
録音途切れ,録音途切れ | |
他音声混入,ノイズ混入 | |
講演開始までのやり取り(転記なし) | |
F, D, M | タグ付けされたテキストをそのまま表示 |
#ref(): File not found: "himawari_browse_transcript.png" at page "全文検索システム『ひまわり』/『昭和話し言葉コーパス』"
本研究は,国立国語研究所共同研究プロジェクト「大規模日常会話コーパスに基づく話し言葉の多角的研究」の一環として行われました。
全文検索システム『ひまわり』の作成にあたっては,次のJSPS科研費の助成を受けています。