話者間関係性・年齢の上下関係アノテーション

話し手から見た聞き手との関係性・年齢の上下関係の情報

CEJCでは、個々の発話が誰に宛てられたものかを特定するアノテーションは提供していません。しかし、会話全体として、話者の発話の宛先がどのような関係性の人であるかを一意に特定できるケースがあります。例えば二人会話であれば発話の相手は一意に定まります。また三人以上の会話でも、 下記の図のように相手との関係性を一意に特定できることがあります。



このように会話の構成メンバーの属性を考慮した上で、相手との関係性や年齢の上下関係が特定できる場合に限定してその情報をまとめました。sessionIDとinformantIDをキーに結合することで分析に利用することができます。

関係性としては、「家族」のような大分類、「子供」のような中分類、「娘」のような小分類を設けています。大分類では特定できても、中分類や小分類では不定のこともあります。

また年齢については、友人知人と仕事に限定して提供します。一般に公開している5歳刻みの年齢ではなく実年齢をもとにした上で、年齢差が5歳未満、あるいは10歳未満、あるいは15歳未満の場合に同世代、それより上、下の場合を年上・年下としています。友人知人の仕事関係の場合のみ年齢の上下の情報を特定しています。

なお、例えば友人3人会話の場合、相手との関係性は「友人知人」となっていますが、一時的に店員との会話が生じるといったケースもあります。こうした一時的な話者については考慮に入れていません。


⌘ データのダウンロード ⌘


⌘ 提供データ(informant_relation.csv)の情報 ⌘


  • sessionID:セッションID ※中納言の「会話ID」からオプションで付いている末尾のa,b,c,dを除いたもの

  • informant:話者ID

  • relation1a:話し手から見た聞き手との関係性・大分類

      ▶ 家族,家族親戚,友人知人,仕事,先生生徒,初対面

  • relation1b:話し手から見た聞き手との関係性・中分類

      ▶ 家族: 父母, 子供, 配偶者, 兄弟姉妹, 祖父母, 孫
      ▶ 家族親戚: 義父母, 義理の子供
      ▶ 仕事: 同僚, 取引先など他社の人, サービス提供者, 客, その他
      ▶ 先生生徒: 先生, 生徒
      ▶ 友人知人: 友人知人
      ▶ 初対面: 初対面

  • relation1c:話し手から見た聞き手との関係性・小分類(家族の場合のみ提供)

      ▶ 家族: 父母: 父, 母
      ▶ 家族: 子供: 息子, 娘
      ▶ 家族: 配偶者: 夫, 妻
      ▶ 家族: 兄弟姉妹: 兄, 妹, 姉, 弟
      ▶ 家族: 祖父母: 祖父, 祖母
      ▶ 家族: 孫: 孫息子, 孫娘
      ▶ 家族: 義父母: 義父, 義母
      ▶ 家族: 義理の子供: 義息子, 義娘

  • relation2a:年下, 同世代, 年上 ※年齢差が15歳未満の場合に同世代

  • relation2b:年下, 同世代, 年上 ※年齢差が10歳未満の場合に同世代

  • relation2c:年下, 同世代, 年上 ※年齢差が5歳未満の場合に同世代