C001_001_MIX.mp4 の差し替え(2024年6月14日)
- 会話 C001_001 のうち個々のカメラを合成した C001_001_MIX.mp4 について、一部映像に乱れがありました。【こちら】から新しい映像をダウンロードすることができます(中納言へのログインが必要です。有償版契約者に限ります)。
関係性・年齢の上下関係の情報(2024年3月26日)
- 関係性・年齢の上下関係の情報を新たに公開しました。会話の構成メンバーの属性を考慮した上で、相手との関係性や年齢の上下関係が特定できる場合に限定してその情報をまとめたものです。
短単位語彙表(分類語彙表番号つき)・分類語彙表番号アノテーション(2024年3月5日)
ELAN用転記ファイルのメディアの設定(2023年9月28日)
- 電話会話のうち映像を公開していないものについて、映像ファイルへのリンクが誤って指定されていたため、ELAN用の転記ファイルを修正しました(会話ID:K001_011, K001_019, K004_001, K005_019a, K005_019b, K005_024, K005_033, K006_016, T006_005, T021_015)。【こちら】(ファイル名:eaf.zip)からまとめてダウンロードできます(中納言へのログインが必要です。有償版契約者に限ります)。元のファイルもリンクをはり直すことで使用することができます。
リレーショナルデータベースの公開(2023年4月3日)
- リレーショナルデータベース(CEJC-RDB, SQLite版)を新たに構築して有償版契約者を対象に公開しました。【こちら】からダウンロードできます(中納言へのログインが必要です。有償版契約者に限ります)。
CEJC-RDBの詳細は【こちら】をご覧ください。
CEJC ver.202303 (2023年03月24日)
以下の一連の問題を修正し、Ver.202303 として有償版の関連データをアップデートしました。【こちら】から入手できます。またICと話者の対応の誤りについては中納言版も更新しました。
ICと話者の対応の誤り:
ICと話者の対応の一部に誤りがありました。またT004_010abの「IC03_由里子」の話者ラベルは「IC03_八重子」の誤りです。
会話ID |
旧 | 新 |
旧 | 新 |
C002_006a,b,c |
IC03_美佳 | IC02_美佳 |
IC02_遥 | IC03_遥 |
K003_017 |
IC03_詩織 | IC02_詩織 |
IC02_由佳 | IC03_由佳 |
K004_001 |
IC01_島村 | IC02_島村 |
IC02_母 | IC01_母 |
T013_006 |
IC02_須賀 | IC04_須賀 |
IC04_草野 | IC02_草野 |
韻律ラベリングの更新:
韻律ラベリングのアノテーションを更新しました。これに伴い転記テキストなどの時間情報を一部修正しました。
談話行為の参照先の重複:
参照先の重複を修正しました
時間情報
韻律ラベリングのアノテーションの更新に伴い、転記テキストや形態論情報などに含まれる時間情報を一部修正しました。
係り受け情報の公開(2023年1月1日)
- 係り受け情報を有償版契約者を対象に公開しました。【こちら】からダウンロードできます(中納言へのログインが必要です。有償版契約者に限ります)。
音声ファイルの設定(2022年10月4日)
- 音声ファイルは「個人IC:16kHz・モノラル、それ以外:16kHz・ステレオ」の設定で提供していますが、一部のファイルに関して高い設定(個人IC:48kHz・ステレオ、それ以外:48kHz)となっていたため、配布サイトの音声を更新しました【対象ファイルリスト】。【こちら】(ファイル名:wav_20221004更新.zip)からまとめてダウンロードできます(中納言へのログインが必要です。有償版契約者に限ります)。なお、更新前の音声ファイルでも再生に問題はありません。
T009_011b 転記テキスト(2022年7月15日)
- 会話 T009_011b について、映像・音声は9分10秒ありますが、2022年3月31日に提供した転記テキスト・短単位情報・長単位情報につきましては、3分24秒までしかありませんでした。このうち転記テキストについては、有償版契約者に対して9分10分まで書き起こしたものを配布サイトから提供します。【こちら】(ファイル名:T009_011.zip)からダウンロードできます(中納言へのログインが必要です。有償版契約者に限ります)。