データの概要

1.C-JASの概要(データ)

 C-JASとは、Corpus of Japanese as a Second Languageの略で、日本で日本語を第二言語として学んでいる学習者の発話コーパスである。このコーパスは、外国人の日本語習得に興味を持ち、研究する方々や日本語教師の方々に利用していただきたいと考えて作成した。
このコーパスには、以下の通り3つの特徴がある。

(1)中国語・韓国語を母語とする特定の学習者を約3年間調査して収集した発話データである

(2)文法習得の研究を目的として収集された自然な会話データである

(3)コーパス付属の検索システムを備え、オンラインで使用できる

 

2.学習者の概要

 学習者の性別、母語、調査期間の年齢、学習者の環境を表1にまとめた。詳細は以下の通りである。下記6名の学習者は全員教室環境学習者であり、最初の1年間は同じ日本語学校で同じ時期に初級から日本語を学んだ。

表1.学習者の概要

  性別 母語 調査期間の年齢 学習者の環境
C1 中国語 25歳~28歳 1期:日本語学校
3~4期:大学1年生(看護系)
5~8期:大学2年生
C2 中国語 20歳~23歳 1期:日本語学校
2~5期:短大1年生(国文系)
6~8期:短大2年生
C3 中国語 22歳~25歳 1~2期:日本語学校
3~5期:大学研究生(商学系)
6~8期:大学1年生(他大学商学系)
K1 韓国語 21歳~24歳 1~2期:日本語学校
3~4期:別の日本語学校
5~8期:専門学校1年生
K2 韓国語 18歳~21歳 1~2期:日本語学校
3~4期:大学1年生(工学系)
5~8期:大学2年生
K3 韓国語 21歳~24歳 1~3期:日本語学校(3期後やめる)
4~5期:主婦兼アルバイト
6~8期:大学1年生(商学系)

 

3.データの収集時期

 データの収集時期は1991年7月~1994年3月である。学習者1人につき8回の調査が行われた。一回の調査は、約60分の対話形式である。データの名称として、1回目から8回目までの調査時期ごとに1期から8期と呼ぶこととする。C1のみ2回目(*1)のデータが欠けているため、データの総数は47本である。また、K1の2期目(*2)のデータは30分である。データそれぞれの内訳と調査日は以下の表2の通りである。

表2.データの内訳と調査日

中国語母語話者 韓国語母語話者
C1 C2 C3 K1 K2 K3
C1‐1期(’91/7/24) C2‐1期(’91/6/27) C3‐1期(’91/8/22) K1‐1期(’91/9/9) K2‐1期(’91/7/10) K3‐1期(’91/9/12)
*1 C2‐2期(’92/5/1) C3‐2期(’92/3/15) *2  K1‐2期(’92/2/24) K2‐2期(’91/12/4) K3‐2期(’92/3/13)
C1‐3期(’92/8/5) C2‐3期(’92/7/19) C3‐3期(’92/7/16) K1‐3期(’92/7/22) K2‐3期(’92/7/17) K3‐3期(’92/7/5)
C1‐4期(’92/12/20) C2‐4期(’92/11/30) C3‐4期(’92/11/23) K1‐4期(’92/12/21) K2‐4期(’92/12/5) K3‐4期(’92/11/29)
C1‐5期(’93/4/26) C2‐5期(’93/3/2) C3‐5期(’93/3/21) K1‐5期(’93/4/20) K2‐5期(’93/4/2) K3‐5期(’93/3/18)
C1‐6期(’93/7/27) C2‐6期(’93/7/16) C3‐6期(’93/8/2) K1‐6期(’93/7/27) K2‐6期(’93/8/31) K3‐6期(’93/8/22)
C1‐7期(’93/12/12) C2‐7期(’93/12/16) C3‐7期(’93/12/29) K1‐7期(’93/11/27) K2‐7期(’93/12/27) K3‐7期(’93/11/11)
C1‐8期(’94/3/9) C2‐8期(’94/3/8) C3‐8期(’94/3/8) K1‐8期(’94/3/10) K2‐8期(’94/3/4) K3‐8期(’94/3/12)

 

4.データの内訳

【調査】 1人につき7~8回(1回約60分)

【データ量】 47本(計約46時間30分 約57万語)

【Research Methods】Free conversation with native speakers of Japanese (common topics for each research period.)

【データ公開方法】 プレインテキスト(テキストファイル)

オンライン検索(コーパス検索アプリケーション『中納言』での検索)

 

5.使用教材

 学習者が1年目に日本語学校で使用した教科書は以下の通りであった。

『日本語初歩』 国際交流基金日本語国際センター

 

.インタビューのテーマ

 8回の調査はそれぞれ共通の話題が設定されており、それを含めた母語話者との自由会話となっている。
調査期ごとの共通の話題は以下の通りである。

1期:小・中学校の先生の思い出

2期:留学1年を振り返って

3期:私の日本人の友達

4期:私の学校生活

5期:日本人について

6期:休日の過ごし方

7期:日本の衣食住について

8期:日本での3年間を振り返って