利用ガイドライン

『日本語日常会話コーパス』には、日常生活の中で交わされる様々な場面の会話の音声・映像データが収められています。こうした貴重なデータの収集・公開は、本コーパスが果たす学術的・教育的な意義にご理解くださった一般の方々のご協力があって実現したものです。データには多くの個人情報が含まれているため、不適切な方法でデータを管理・活用することによって、調査にご協力いただいた方々が不利益を被るリスクがあります。データの流出などの問題が生じた場合、『日本語日常会話コーパス』の公開を停止する事態も生じかねません。この点を十分ご理解いただいた上で、利用許諾契約書および本ガイドラインに従い、データの保管や研究利用、成果発表の方法などに関して細心の注意を払うようお願いします。



利用目的の範囲・利用方法

利用許諾契約書第8条第6項では「日常会話コーパス及びサンプルデータを用いて甲または第三者の名誉等を毀損し、あるいはその他の権利を侵害すること」を禁止事項として挙げています。本コーパスでは特に会話者や会話者以外の第三者の個人情報・プライバシー・著作権等の保護の観点において、次のような利用が禁止される行為に該当しますので、行わないよう注意してください。

  • 会話の内容などを手掛りに、個人の特定に繋がる情報を探しあて、その情報を公開すること。ここでいう「公開」には、論文等での言及も含まれます。

    例)会話者が属していると予想される団体名やそのホームページのURLの公開
    例)会話者のものと予想されるSNSアカウントの公開
  • 音声・映像データに記録されている発話や行動などについて、事実関係の正誤や、思想・信条・生活スタイルなどの適否・賛否を、特定個人と結び付けて論じること。
  • 転記テキストに記されていない第三者の発話が音声データに入り込んでいた場合に、その発話内容について議論すること。
  • 音声・映像データに入り込んだ第三者に関する情報や施設などの情報を公開すること。

    例) 飲食店のメニュー・営業時間、店員の性別や人数などの情報を公開
  • その他、会話者や第三者の個人情報・プライバシー・著作権等を侵害するような扱いをすること。

データの管理

  • データを格納したハードディスクは、必ず鍵をかけた場所に保管してください。
  • 利用者のみが使用するコンピュータにデータを複製する場合、データが不用意に流出しないよう、当該コンピュータは、1) ログインに際し認証がかかっていること、2) サポート期限切れのOS・アプリケーションを使用していないこと、3) セキュリティ対策ソフトが正常に機能していること、4) ファイル交換ソフトがインストールされていないこと、5) 端末の盗難対策がなされていることなどを確認し、適切な対策を講じるようにしてください。
  • 研究室等での利用において複数人がデータを使用する場合、責任者(契約時における「コーパス管理者」)は次の対応を行ってください。
    • 研究室等に所属する者に対し、このガイドラインに記す内容を周知し遵守するようにしてください。
    • サイトからのデータのダウンロードやその管理は、責任者のもとで適切に対応してください。
    • 研究室等での利用のために、所属する職員・学生等が使用するコンピュータにデータを複製する場合、あるいはファイルサーバなどネットワーク環境にデータを複製する場合には、データが不用意に流出しないよう、上記2に記す対応をとると同時に、権利を有するユーザ以外がアクセスできないように環境を整備するなど、適切な対策を講じるようにしてください。

研究成果の公表

  • データ(音声・映像・転記テキスト・アノテーション・メタ情等報)の再配布と認められる形態での発表はできません。

    例) データを組み込んだプログラムの公開
    例) KWICデータ(並べ換えることでサンプルが復元できるもの)
    例) 独自のアノテーションを施したデータ(転記テキスト等の情報を含むもの)
  • 研究成果を発表する場合、『日本語日常会話コーパス』を利用した成果であることを明記し、【こちら】に記載する文献を参照してください。
  • 論文等の著作に転記テキストを引用する場合、論旨の把握に必要最低限の範囲としてください。
  • 口頭発表・ポスター発表等において、論旨の把握に必要最低限の範囲でCEJCに含まれる音声・映像を再生してよいものとします。ただし、主催者や聴衆などが、再生された会話音声・映像を記録し、ネット等で配信するなどの行為を行わないよう、再生する前に注意喚起してください。
  • 論文等に会話場面の映像のサンプルを掲載する場合、論旨の把握に必要最低限の範囲に留めるようにしてください。その際、以下のように、イラストにする、顔や車のナンバーなどにマスキング処理をほどこすなどして、個人が特定できないよう対応してください。特に論文のPDF等がインターネット上で公開される場合には細心の注意を払ってください。

     

研究成果の報告

  • 研究成果の発表にあたり、事前あるいは随時の報告は不要とします。ただし、年1~2回程度、成果情報の収集をする予定です。その場合には期限内に回答してください。

授業や演習等での利用について(有償版をご利用の方)

  • 授業や演習などで、教員やスタッフが音声・映像を再生したり、教材資料に転記テキストや映像のサンプルを引用・掲載する場合には、「研究成果の公表」に準ずる扱いとします。
  • 演習などにおいて、受講生自身が音声・映像データを閲覧操作する等の利用をする場合には、次の通りとします。
    • 教員やスタッフが、データや受講生の管理を徹底できる限りにおいてその使用を認めます。少人数の演習などが考えられます。
    • 事前に次の情報をcejc-release [at] ninjal.ac.jp まで報告し許可を得てください。時間に余裕をもってご相談ください。

      組織名(学部学科レベルまで)・授業名・教員等責任者の氏名
      受講者の属性(学部生か大学院生か)・人数(概算可)
      利用目的や利用方法の概要
      データの取り扱いの具体的方法(下記を参考のこと)
    • 閲覧操作の対象とするデータは、当該の演習等に必要最低限の範囲に留めてください。
    • 受講生が占有するコンピュータにデータを複製して利用する場合、データが不用意に流出しないよう、当該コンピュータは、「データの管理」に記す対策を講じてください。また、演習等以外の目的でデータを使用することは禁止し、CEJCを利用する一連の演習等が終了した時点でデータをすべて削除してください。
    • 受講生以外もアクセス可能なコンピュータにデータのバックアップをとって利用する場合、1回の演習等が終わるたびにデータをすべて削除してください。また当該コンピュータは、「データの管理」2に記す対策を講じてください。
    • 教員やスタッフは、受講生に本利用ガイドラインに記す内容を周知し遵守させるようにしてください。
    • 受講者が、演習での発表やレポート等を越えて得られた成果を広く公表する場合には、利用許諾契約を交わす必要があります。学会発表や論文発表などがこれに相当します。