国立国語研究所 〒190-8561 東京都立川市緑町10-2 Tel. 0570-08-8595 (ナビダイヤル)
© National Institute for Japanese Language and Linguistics
CEJCでは、個々の発話が誰に宛てられたものかを特定するアノテーションは提供していません。しかし、会話全体として、話者の発話の宛先がどのような関係性の人であるかを一意に特定できるケースがあります。例えば二人会話であれば発話の相手は一意に定まります。また三人以上の会話でも、 下記の図のように相手との関係性を一意に特定できることがあります。
このように会話の構成メンバーの属性を考慮した上で、相手との関係性や年齢の上下関係が特定できる場合に限定してその情報をまとめました。sessionIDとinformantIDをキーに結合することで分析に利用することができます。
関係性としては、「家族」のような大分類、「子供」のような中分類、「娘」のような小分類を設けています。大分類では特定できても、中分類や小分類では不定のこともあります。
また年齢については、友人知人と仕事に限定して提供します。一般に公開している5歳刻みの年齢ではなく実年齢をもとにした上で、年齢差が5歳未満、あるいは10歳未満、あるいは15歳未満の場合に同世代、それより上、下の場合を年上・年下としています。友人知人の仕事関係の場合のみ年齢の上下の情報を特定しています。
なお、例えば友人3人会話の場合、相手との関係性は「友人知人」となっていますが、一時的に店員との会話が生じるといったケースもあります。こうした一時的な話者については考慮に入れていません。
⌘ データのダウンロード ⌘
⌘ 提供データ(informant_relation.csv)の情報 ⌘