研究班3:日本語表記・音声の実験言語学的研究



「文字言語チーム」

賀集 寛(川崎医療福祉大学教授 関西学院大学名誉教授)

 本チームの研究は,日本語の文字言語に関する2つの大規模な調査と,それから派生する諸問題の検討,および,日本の心理言語学に関する文献的研究の,3つに大別される。
 第1は,研究代表者,賀集を中心として推進した日本語の表記に関するものである。日本語,750語について,漢字・ひらがな・カタカナの,どの表記で書くことが多いのかという,3つの表記形態の表記頻度(主観的表記頻度と命名)の標準的資料と,それに基づいて,750語すべてを10の表記型に分類したリストを作成し,公表した。
 ところで,従来は,漢字は,認知では仮名より勝り,音読では仮名に劣るとされてきたが,表記調査から派生して実施したいくつかの研究から,主観的表記頻度の高い語では,漢字であっても,音読時間は仮名と大差ないし,仮名であっても,認知生成期は漢字とほぼ同等であるという結果を得た。つまり,ある語の言語処理に影響を与えるのは,その語の表記形態よりも,主観的表記頻度の方であると結論することができるのである。なお,このほか,主観的表記頻度を規定する諸要因の分析や表記の「ゆれ」の問題等も検討した。
 第2は,研究分担者,横山を中心とするの使用頻度に関するものである。日本語教育で教材に使用される漢字の選定と,提示順序は,漢字実態調査に基づいて決定されることが多い。そのために,まず,新聞記事フルテキストデータベース中に含まれる,漢字使用頻度を調査するシステムを開発し(これについての論文が,「日本教育工学会論文賞」を受賞),これを用いて,「朝日新聞」記事約11万件(延べ字数5500万)と,そのCD-ROMを対象に,電子メディアにおける漢字実態を明らかにする,計量言語学的な基礎資料が得られ,新聞社の著作権使用許可を得て,これを本邦初公開した。今後は,以上のように,電子メディアによる文字を扱う時,人間の知識や文化の影響に加えて,媒体自体を取り巻く諸問題(たとえば,漢字の形態)も考慮にいれた,総合的な分析が要求されるであろう。
 第3は,研究分担者,Kessによるものである。彼は,世界中から収集した,心理言語学を中心とする,日本語を研究対象とする文献の独自の要約を作成,これを広く世界に紹介した。さらに,最近では日本語文字言語の語彙接近的研究や半球機能差の項目を含む,種々の心理言語学的研究のレビューを行い,その意義を論じているが,これらは,本チームの研究の評価と方向づけに大いに役立っているところである。
 研究成果は,本科学研究費による,論文集,報告集や,学会研究誌,大学紀要,学会発表論文等に,逐次投稿してきたが,主な内容は,次の単行本にまとめて出版した。

 Kess,J.F.& Miyamoto,T. 1994 Japanese psycholinguistics: A classified and annoted research bibliography. John Benjamins Publishing Company
 浮田 潤・杉島一郎・皆川直凡・井上道雄・賀集 寛 1996 日本語の表記形態に関する心理学的研究 心理学モノグラフ,No.25 日本心理学会
 横山詔一 1997 表記と記憶 心理学モノグラフ,No.26 日本心理学会
 横山詔一・笹原宏之・野崎浩成・エリク・ロング 1998 新聞メディアの漢字 三省堂





「音声言語の韻律特徴に関する実験的研究」
Experimental Studies of Prosody (ESOP)チーム

鮎澤孝子(東京外国語大学)

 ESOPチームは日本語音声の韻律特徴の研究・教育のためのマルチメディアプログラム作成を目標として実験的研究を行ってきた。99年3月19日・20日に成果報告会とワークショップを東京外国語大学で開催し,約80名が参加した。
 日本国内,海外の諸地域の日本語学習者を対象として「東京語アクセントの聞き取りテスト」を実施してきたが,その結果を参考にし,アクセント,イントネーションの習得支援用のパソコンソフトを完成させた。今回,これらのソフトをCD-ROMにまとめ(新プロホームページ参照),本研究の成果として日本語学習者,日本語教育・研究者に配布する。 このCD-ROMの内容はA,B,C,D,Eの5つに分かれている。
 Aは10か国の言語(映像,音声,文字付き)で東京語アクセント,平叙・疑問イントネーションを解説し,簡単な練習をつけたもの。Bは日本語イントネーション練習ソフトで,モデル音声,学習者の音声のピッチ曲線を自由に操作したり,モデル音声と学習者の音声の韻律特徴を比較したりできるソフト。Cは東京語アクセントの音声的特徴であるピッチ下降を聞き取る練習ソフトで,Macintosh版。Dは同じもののWindows版。Eは東京語アクセントの聞き取りテストテープ3種と回答集計用シート等である。
 それぞれ,まだ改善の余地があり,利用者からのご批評,コメントをいただきたい。今後,これらのソフトを用い,より充実した変化のある音声教育教材を作成していきたいと思っている。これまで5年間,多くの方々からご協力とご支援いただいたことに対し心から御礼申し上げたい。





「表記・表現に関する計算機による実験的研究」

中野 洋(国立国語研究所)

1.非漢字圏の日本語学習者にとって漢字の読み書きは,学習上の大きな壁である。文章の理解を妨げることのない範囲で,機械的に使用漢字を減少させるコンピュータ・プログラムができれば,学習者にとっても教師にとっても便利だろう。実用化のための第1段階として,単語分割,読み仮名付け,漢字・ひらがな・カタカナ・ローマ字表記の変換,語種判別機能を持った表記変換プログラムを作成した。以下は,その一例である。

[入力文] 我が国の拳銃対策  拳銃の押収状況をみると,その大半は密輸入されたものであり,国際化の進展に伴い,今後,更に海外からの流入の増加が危惧されます。

[処理結果 学習漢字まで使用] 我が国のケンジュウ対策  ケンジュウオウ収状キョウをみると,その大半はミツ輸入されたものであり,国際化の進展にともい,今後,さらに海外からの流入の増加が危されます。

2.日本語の代表的なシソーラスである『分類語彙表』は,語を意味別に配列したものである。文章表現において適切な表現を探すためには欠かすことができない。例えば,先の表記変換結果の片仮名表記が読みにくければ,『分類語彙表』により,「拳銃」は「ピストル」,「押収」は「接収」をみつけ,これに置き換えることができる。また,文章表現だけでなく日本語の研究用としても数多く使われている。その重要性は,国際シンポジウム「シソーラスと世界の言語」の多くの研究発表においても確認された。現在,収録語数約3万6千語から約9万語までに増補し,出版の準備をしているところである。

3.日本語を母語としない人の日本語作文が,意味はわかるがどこか日本語らしくないことがある。それはどこにあらわれるか,なぜそうなるのかについて研究した。まず,「日中作文コーパス」を作成した。これは,中国人学生の日本語母語話者と日本人学生の中国語作文を収集し,これを添削し,電子化したものである。添削者には,自分が日本語・中国語の神様であると思って自由に添削するように求めた。これを用いて母語が,第二言語である日本語や中国語の作文に与える影響を調査・分析した。次は,その結果の一部である。日本語と中国語では,過去を表す方法が異なる。そのために,次のような作文が現れる。

  これは以前なら想像もつかないことである。 -> (略) つかなかったことである。
  当時のソ連の歌の多くは,メロディが優美ですので -> (略) 優美だったので

 上の例は,中国語では「以前」のような過去を表す語が来れば動詞を過去形にしなくてもよい,下の例は物事を形容する語は過去形にしないという母語の影響を受けたと考えられる。同様の理由で日本人学生も中国語作文で誤りを犯す。中国語の過去を表す助詞「了」では,これを付けなくてもよいのに付けてしまった誤りが付け忘れた誤りより3倍も多い。しかも句中ではなく,句末に置いてしまうのも日本語の影響だろう。詳しくは,研究報告書「日中作文コーパスの作成とその利用」を参照されたい。


ホームページ/ インデックス/ 前ページ/ 次ページ/