国立国語研究所 〒190-8561 東京都立川市緑町10-2 Tel. 0570-08-8595 (ナビダイヤル)
© National Institute for Japanese Language and Linguistics
CEJC-Childモニター版では、長短2種類の形態論情報のうち短単位情報のみを提供します。
短単位は、言語の形態的側面に着目して規定した言語単位です。
短単位の認定に当たっては、まず現代語において意味を持つ最小の単位(以下、最小単位と呼びます)を規定します。
その上で、最小単位を文節の範囲内で短単位の認定規定に基づいて結合させる(又は結合させない)ことにより、
短単位を認定します。短単位の詳細については以下をご覧ください。
基本情報(主要な情報) | 説明 |
---|---|
会話ID | |
発話単位ID | 会話ID内で一意に発話単位を特定するID |
話者ラベル・話者ID | |
書字形 | 同じ語形に所属するものとして表記の変異を区別したもの |
タグ付き書字形 | 書字形に転記テキストのタグを付与したもの |
語彙素ID | |
語彙素読み | 語彙素の読みの情報 |
語彙素 | 国語辞書の見出しに相当 |
語彙素細分類 | |
語形 | 同じ語彙素に所属するものとして語形の変異を区別したもの |
品詞 | 品詞の情報 |
活用型 | 動詞・形容詞・助動詞・一部の接尾辞の活用型 |
活用形 | 動詞・形容詞・助動詞・一部の接尾辞の活用形 |
語種 | 和語・漢語・外来語・混種語・記号の別 |
発音形出現形 | 語形に対応する発音の形 |
発音 | 言い誤りなどを含む実際の発音の形 |
仮名 | 人名等を仮名(カメイ)にしているか(1)していないか(0) |
語彙表・語数表は 【こちら】 をご覧ください。