(6)データの更新情報・修正箇所一覧

データ追加・データ修正などの更新履歴です。
更新時の修正箇所の詳細についてもまとめています。

◆2022年5月23日 :データ更新 (データバージョン 2022.05)

  • 第1次公開分の対話タスクに、音声再生機能を付与しました。
  • 表記がゆれていた箇所について表記を統一しました。
  • 語彙素が異なっていたものについて、正しいものに修正しました。
  • 語末に長音がある連体詞(「あのー」「そのー」「このー」など)について、2短単位に分割し、正しい解析を付与しました。
  • 誤解析箇所の修正を行いました。

個々の語彙素に関する修正箇所は I-JASデータ_修正箇所一覧【202205_語彙素】 に記載
個々の誤解析に関する修正箇所は I-JASデータ_修正箇所一覧【202205_誤解析】 に記載
音声に関する修正箇所は 音声編集情報一覧_202205 に記載

 

◆2021年5月31日 :データ更新 (データバージョン 2021.05)

  • 第1次公開分の対話タスクの一部に、音声再生機能を付与しました。
  • 検索条件のマトリックス(条件を絞るためにチェックを入れる表)に調査地のIDを追加するなどの修正をしました。
  • 表記がゆれている箇所の一部について表記を統一しました。
  • 誤解析箇所の修正を行いました。

その他の個々の修正箇所は I-JASデータ_修正箇所一覧_202105 に記載
音声に関する修正箇所は 音声編集情報一覧_202105 に記載

 

◆2020年8月11日 作文データ更新

  • 作文データの修正を行いました。

詳細は I-JASデータ_作文データ修正箇所一覧_20200818 に記載

 

◆2020年3月25日 第五次データ公開 (データバージョン 2020.03)

  • 下記175名のデータを追加しました。

(今回の第五次データ公開で、予定していたすべてのデータの公開となります)

学習者:
中国語母語話者(50名)、韓国語母語話者(50名)、英語母語話者(50名)、
国内教室環境学習者(25名)

  • 誤解析となっていた「あ」の語彙素を「あっ」に修正しました。

公開時のお知らせは I-JAS_第五次データ_一般公開のお知らせ_20200325 に記載
その他の個々の修正箇所は I-JASデータ_修正箇所一覧_20200325 に記載
音声に関する修正箇所は 音声編集情報一覧_202003版.pdf に記載

 

◆2019年5月10日 第四次データ公開 (データバージョン 2019.05)

  • 下記215名のデータを追加しました。

学習者:
中国語母語話者(50名)、タイ語母語話者(35名)、インドネシア語母語話者(35名)、
ドイツ語母語話者(35名)、フランス語母語話者(35名)、
国内教室環境学習者(25名)

  • I-JAS中納言のインターフェイスを変更しました
  1. 検索結果のサンプルIDをクリックすると表示される「詳細な文脈情報」の見出し部分がスクロールされないよう固定しました。
  2. 検索結果の下部の「次へ」ボタンを押すと、次のページの先頭にページが遷移するように修正しました。
  3. 検索条件の「データセット」のうち、第四次データのチェックボックスを有効化しました。
  • 文字化のミスで「そう」にFタグが付いてしまっていたために、品詞が「感動詞」になっていたものを「副詞」にしました。
  • 「ぁ」と表記してあったものを「あ」に修正しました。
  • ドラマ名の「花より男子」は正式な表記と読みが異なるため、テキストでは「花よりだんご」に統一しました。
  • 「セーラームーン」で1短単位になっていたものを、「セーラー」「ムーン」の2短単位に分割し、それぞれの品詞を「名詞」にしました。
  • STの「ケン」の品詞が「記号」や「接尾辞」になっていたものを「名詞」にしました。

公開時のお知らせは I-JAS_第四次データ_一般公開のお知らせ_20190510 に記載
その他の個々の修正箇所は I-JASデータ_修正箇所一覧_20190510  に記載
音声に関する修正箇所は 音声編集情報一覧_201905版.pdf に記載

 

◆2018年5月21日 第三次データ公開 (データバージョン 20180502)

  • 下記210名のデータを追加しました。

学習者:
中国語母語話者(50名)、ベトナム語母語話者(35名)、ハンガリー語母語話者(35名)、
スペイン語母語話者(35名)、ロシア語母語話者(35名)、
国内教室環境学習者(10名)、国内自然環境学習者(10名)

  • 「ま」と「あ」に分割されていた「まあ」は結合し、品詞を「副詞」にしました。
  • 「あ」と「あ」に分割されていた「ああ」は結合し、その文脈に応じて品詞を「感動   詞」あるいは「副詞」にしました。
  • 「じゃ」と「あ」に分割されていた「じゃあ」は結合し、その文脈に応じて品詞を「接続詞」あるいは「助動詞」にしました。
  • 「えっーと」の表記を「えーっと」に修正しました。品詞情報の変更は行っていません。

公開時のお知らせは I-JAS_第三次データ_一般公開のお知らせ_0521 に記載
その他の個々の修正箇所は I-JASデータ_修正箇所一覧_20180521  に記載
音声に関する修正箇所は 音声編集情報一覧_20180502版.pdf に記載

 

◆2017年11月24日 データ更新 (データバージョン 20171124)

  • IDのアルファベットが全て1短単位になるよう修正しました。
  • 更新に伴って発話番号を振り直しました。
  • Fタグでまとめられていたもの(※1)をUniDicの規定に沿って分割し、それぞれに形態論情報を付与しました。
    ※これまでは「えー、あのー、うーん」などのようにフィラーが続くものは、1短単位としてFタグでまとめられていた。

その他の個々の修正箇所は I-JASデータ_修正箇所一覧_20171124 に記載

 

◆2017年5月21日  第二次データ公開 (データバージョン 20170519)

  • 下記225名のデータを追加しました。

学習者:
中国語母語話者(35名)、韓国語母語話者(35名)、英語母語話者(35名)
トルコ語母語話者(35名)、国内教室環境学習者(25名)、国内自然環境学習者(25名)
日本語母語話者(35名)

  • 作文課題(任意調査)の「エッセイ」と「メール3種」をI-JAS中納言(検索システム)の検索対象から除外しました。
  • ストーリーテリング・ストーリーライティングのタイトル・リード文(初めの一文)を検索システムおよびプレインテキストから削除しました。
  • 特定のURLからIDごとに直接フェイスシートを閲覧することが可能にしました。
    ※ 詳細は下記「第二次データ_一般公開のお知らせ_20170520」を参照

公開時のお知らせは 第二次データ_一般公開のお知らせ_20170520 に記載

その他の個々の修正箇所は I-JASデータ_修正箇所一覧_20170607  に記載

 

◆2016年7月31日 データ更新  (データバージョン20160729)

  • 誤解析箇所を修正しました。
  • Y タグに関するデータ変換処理の不具合を修正しました。
  • プレインテキスト [ID 有り] へ下記の情報を追加しました。
    - 補足情報
    - 読み (Y タグの情報)
    - G タグの解析用文字列
    - 連体詞 (R タグの情報)
  • プレインテキスト [ID 無し] の公開を廃止しました。
  • データのバージョンを表示しました。

 

◆2016年5月9日  第一次データ公開  (データバージョン20160420)

  • 下記225名のデータを追加しました。

学習者:
12言語の異なった母語の海外における日本語学習者(15名×12言語)
国内教室環境学習者(15名)、国内自然環境学習者(15名)
日本語母語話者(15名)