ここでは、「中納言」でBCCWJ2を検索した場合の検索結果および検索結果ダウンロード(CSV等)で出力される列(カラム)のうち、 特にコーパス利用で重要になる項目を整理して掲載します。なお、以下の説明は2026年3月現在公開している書籍のデータを対象としたものです。

掲載項目(カテゴリ)

コーパス情報

サンプルID/開始位置/連番/レジスター/コア

形態論情報

語彙素/語彙素読み/語彙素細分類/語形/書字形/発音形出現形

出典情報

執筆者/生年代/ジャンル/編著者等/出版者/出版年/ISBN

コーパス情報

サンプルID

  • 各サンプルに付与された、発行年とジャンル(NDC)を示すID。

開始位置/連番

  • 開始位置:原文文字列のサンプル頭からのオフセット値(10 きざみ)。
  • 連番:サンプル内での短単位の並び順(10 きざみ)。

レジスター

  • 特定の場面や状況において使用される言語変種。

コア

  • 人手により解析精度を高めたサンプルを示す。

形態論情報

語彙素/語彙素読み/語彙素細分類/語形

  • 語彙素:辞書見出しの代表表記に相当(漢字仮名混じり表記)。
  • 語彙素読み:辞書見出しに相当(カタカナ表記)。
  • 語彙素細分類:語彙素を語義等によって更に細分する情報。
  • 語形:異語形を区別するレベルの見出し(カタカナ表記)。

書字形/発音形出現形

  • 書字形:表記を区別するレベルの見出しの形。
  • 発音形出現形:発音を区別するレベルの見出しの形。

出典情報

出典情報は、国立国会図書館が提供する全国書誌データ(https://www.ndl.go.jp/data/data_service/jnb)に基づいています。

執筆者

  • サンプルの執筆者を示す。

生年代

  • 執筆者の生年を10年単位で示す(全国書誌データの生年の数値を1の位で切り捨てて表示)。

ジャンル

  • 書籍、教科書、SNSなど、作品のジャンル情報を示します。(2026年3月時点では書籍のみ)
  • 書籍の場合、NDC(日本十進分類法)の大分類と詳細分類、および、NDLC(国立国会図書館図書分類)を示す。

編著者等

  • 書籍の著者、編者を示す。

出版者

  • 書籍の出版元を示す。

出版年

  • 書籍の刊行年を示す。

ISBN

  • 書籍のISBN(国際標準図書番号)を示す。

BCCWJ1との違い

  • 執筆者の性別は表示されません。
  • ジャンルの3列目はBCCWJ1ではCコードでしたが、BCCWJ2ではNDLC(国立国会図書館図書分類)になります。