国立国語研究所 〒190-8561 東京都立川市緑町10-2 Tel. 0570-08-8595 (ナビダイヤル)
© National Institute for Japanese Language and Linguistics
次の2つの単位で区切られた転記テキストを提供しています。 いずれも(1)話者ラベル、(2)開始時刻、(3)終了時刻、(4)発話内容の4つの情報が単位ごとに記されています。
①発話単位
話者ラベル | 開始時刻 | 終了時刻 | 発話 |
---|---|---|---|
IC03_さとし | 855.867 | 858.202 | こっち(W (D ライ)|ライフ) スーパーと言えばライフだと思ってたけど:。 |
IC03_さとし | 859.195 | 860.782 | 案外そうでも:(0.275)ないの?。 |
IC01_一ノ宮 | 860.330 | 860.722 | うん。 |
IC01_一ノ宮 | 860.919 | 861.947 | 案外そうでもない。 |
IC03_さとし | 861.944 | 862.237 | うん。 |
IC03_さとし | 862.320 | 864.359 | サミット(0.641)もあるし。 |
②転記単位
話者ラベル | 開始時刻 | 終了時刻 | 発話 |
---|---|---|---|
IC03_さとし | 855.867 | 858.202 | こっち(W (D ライ)|ライフ)スーパーと言えばライフだと思ってたけど:。 |
IC03_さとし | 859.195 | 860.112 | 案外そうでも: |
IC01_一ノ宮 | 860.330 | 860.722 | うん。 |
IC03_さとし | 860.387 | 860.782 | ないの?。 |
IC01_一ノ宮 | 860.919 | 861.947 | 案外そうでもない。 |
IC03_さとし | 861.944 | 862.237 | うん。 |
IC03_さとし | 862.320 | 862.896 | サミット |
IC03_さとし | 863.537 | 864.359 | もあるし。 |
転記テキストは2種類の単位(発話単位・転記単位)ごとに以下の3つのファイル形式で提供されます。
ファイル形式 | 対応アプリケーション | アプリケーションのサイト |
---|---|---|
CSVファイル | Excelやテキストエディタなど | |
EAFファイル | 映像解析ソフトウェアELAN | 【外部サイト】 |
TextGridファイル | 音声分析ソフトウェアPraat | 【外部サイト】 |
「IC01_一ノ宮」などの話者ラベル(speakerID)は、各話者が装着したICの番号と、各話者の愛称に相当するラベル(仮名)の組合せで構成されています。このうち愛称に相当するラベル(仮名)は、同じ協力者が集めた会話の中では全て同じものが使われています。IC番号の部分については、ICから開始するもの、NあるいはZから開始するものがあります。それぞれ次の通りです。
本コーパスでは、 話者の名前、所属組織名、自宅・所属組織の住所・電話番号、旅券番号やマイナンバーなどの個人識別符号、 および本人が公開を希望しない箇所を、 仮名 あるいは「*」(全角アスタリスク)で伏せ字化しています。