NPCMJとは?

多様な日本語の機能語や句構造、節の諸類型および複雑な構文を大量の言語データから検索・抽出して研究することを可能にすることを目的として、現代日本語の書き言葉と話し言葉のテクストに対し文の統語・意味解析情報をアノテートしたコーパスです。

講習会の内容は?

今回の講習会では、データの概要、インターフェースの使い方、検索結果のダウンロードとローカル環境での利用を扱います。
インターフェースの使い方では、様々な文字列検索とツリー検索の方法を解説します。
事前にNPCMJ ウェブサイト https://npcmj.ninjal.ac.jp/interfaces/ をご覧頂くことをお勧めします。

必要なものは?

当日、各自PCをお持ちください。ブラウザはFirefox をお勧めします。
ネットワーク環境が必要です。念のため接続機器をお持ちの方はご持参ください。

2022年3月4日 統語・意味解析コーパス(NPCMJ)チュートリアル

開催日時:2022年3月4日 (金) 10:00~17:00
開催場所:Web開催(参加申込をいただいた方に、ZoomのURLをメールでお送りいたします)
参加申込:参加希望の方は、以下のサイトから2022年2月28日(月)までに参加申し込みをお願いします。
こちら(リンク)からお申込みください。

プログラム(予告なしに変更する場合があります)
  • 1. NPCMJ コーパスの理念とデータの概要、および初心者向けインターフェース[配布資料1][配布資料2]
    プラシャント・パルデシ、鈴木彩香 10:00~11:00 (60分)
    休憩:11:00~11:10
  • 2. タグおよびアノテーションの概要[配布資料]
    吉本啓 11:10~12:10 (60分)
    休憩:12:10~13:15
  • 3. 検索インターフェース(NPCMJ Development Interfaces)[配布資料]
    Alastair Butler, 長崎郁 13:15~14:00 (45分)
    休憩:14:00~14:10
  • 4. Tregex 検索式1(tag の記述)[配布資料]
    金城由美子 14:10~15:10 (60分)
    休憩:15:10~15:20
  • 5. Tregex 検索式2(tree の記述)[配布資料]
    長崎郁 15:20~16:50(90分)
  • 6. Concluding Remarks
    プラシャント・パルデシ 16:50~17:00 (10分)
2021年3月13日 統語・意味解析コーパス(NPCMJ)チュートリアル

開催日時:2021年3月13日 (土) 10:00~17:00
開催場所:Web開催(参加申込をいただいた方に、ZoomのURLをメールでお送りいたします)
参加申込:参加希望の方は、以下のサイトから2021年3月10日(水)までに参加申し込みをお願いします。
こちら(リンク)からお申込みください。

講習資料(zipファイル)をこちらからダウンロードしてください。

この講習会の動画はYouTubeチャンネルで公開されています。

プログラム(予告なしに変更する場合があります)
  • 1. NPCMJ コーパスの理念とデータの概要、および初心者向けインターフェース
    プラシャント・パルデシ、鈴木彩香 10:00~11:00 (60分)
    休憩:11:00~11:10
  • 2. タグおよびアノテーションの概要
    吉本啓 11:10~12:10 (60分)
    休憩:12:10~13:15
  • 3. 検索インターフェース(NPCMJ Development Interfaces)
    Alastair Butler, 長崎郁 13:15~14:00 (45分)
    休憩:14:00~14:10
  • 4. Tregex 検索式1(tag の記述)
    金城由美子 14:10~15:10 (60分)
    休憩:15:10~15:20
  • 5. Tregex 検索式2(tree の記述)
    長崎郁 15:20~16:50(90分)
  • 6. 閉会の辞
    プラシャント・パルデシ 16:50~17:00 (10分)
2020年2月1日 統語・意味解析コーパス(NPCMJ)チュートリアル

開催日時:2020年2月1日 (土) 10:00~18:00
開催場所:東京都港区港南二丁目15番2号 品川インターシティ ホール&貸会議室 B1F 会議室5 [アクセス]
参加申込:参加希望の方は、以下のサイトから2020年1月26日(日)までに参加申し込みをお願いします。
こちら(リンク)からお申込みください。(チュートリアルの受付が終了しました。キャンセル待ちで参加希望を受け付けています。参加希望の方はprashant@ninjal.ac.jpまでご連絡ください。)
受入れ人数は40名の予定です。数に限りがあり、応募順に締め切りますので、お早めにお願いします。

※ 当日はWiFi に接続可能なノート PC を持参願います。会議場で WiFi が利用可能ですが、処理が遅くなるおそれがあるので、なるべく各自ルーターをご用意下さい。

事前準備:事前に NPCMJ ウェブサイト https://npcmj.ninjal.ac.jp/interfaces/ にアクセスし,ご覧頂くことをお勧めします。また,次の2つを自身の PC にダウンロードしておいてください。

  1. NPCMJ データ — https://npcmj.ninjal.ac.jp/interfaces/cgi-bin/index.sh?db=npcmj&lang=jp (”Download all bracketed trees” と書かれた黄色いボックスをクリックしてください)
  2. Tregex(検索ソフト) (The Stanford Natural Language Processing Group のサイト(https://nlp.stanford.edu/software/tregex.html#Download) から Version 3.9.2 をダウンロード)
プログラム
  • コーパスの理念と概要、および初心者向けインターフェース
  • データとアノテーションの概要
  • 検索インターフェース、tregex 検索式
  • ローカル環境での利用
2019年5月11日 統語・意味解析コーパス(NPCMJ)チュートリアル

開催日時:2019年5月11日 (土) 10:00-17:30
開催場所:弘前大学創立50周年記念会館 会議室2 [アクセス]
参加申込:事前申込制です。こちら(リンク)からお申込みください。

※ 当日は各自PCをご持参ください。

事前準備:事前に NPCMJ ウェブサイト にアクセスし,ご覧頂くことをお勧めします。また,次の2つを自身の PC にダウンロードしておいてください。

 

 

  1. NPCMJ データ — https://npcmj.ninjal.ac.jp/interfaces/cgi-bin/index.sh?db=npcmj&lang=jp (”Download all bracketed trees” と書かれた黄色いボックスをクリックしてください)
  2. Tregex(検索ソフト) (The Stanford Natural Language Processing Group のサイト(https://nlp.stanford.edu/software/tregex.html#Download) から Version 3.9.2 をダウンロード)
プログラム
  • (1) NPCMJ コーパスの理念と概要、および初心者向けインターフェース (プラシャント・パルデシ) [配布資料]
  • (2) データの概要とタグの検索 (吉本 啓)[配布資料1] [配布資料2]
  • (3) グラフィカルインターフェースを使った検索式の作成 (鈴木 彩香)[配布資料]
  • (4) TGrep-lite 検索式 1 (鈴木 彩香)[配布資料]
  • (5) TGrep-lite 検索式 2 (吉本 啓)[配布資料]
  • (6) TGrep-lite 検索式 3 (長崎 郁)[配布資料]
  • (7) ローカル環境での利用法について (長崎 郁)[配布資料]
2019年1月26日 統語・意味解析コーパス(NPCMJ)チュートリアル

開催日時:2019年1月26日 (土) 10:00-17:30
開催場所:東北大学 川内北キャンパス 国際文化研究棟1階 国際文化会議室 (101室)
宮城県仙台市青葉区川内41
川内キャンパス (Aエリア) マップ
(仙台市地下鉄東西線 川内駅 (キャンパス直結) )
参加申込:事前申込制です。こちらからお申込みください。

※ 当日は各自PCをご持参ください。

プログラム
  • プラシャント・パルデシ 「NPCMJ コーパスの理念と概要」
  • 吉本 啓 「データの概要とタグの検索」
  • 鈴木 彩香 「初心者向けインタフェースについて」
  • 長崎 郁 「グラフィカルインターフェースを使った検索式の作成」
  • 長崎 郁 「TGrep-lite 検索式 1」
  • 吉本 啓 「TGrep-lite 検索式 2」
  • 長崎 郁 「ローカル環境での利用法について」
2018年10月15日 統語・意味解析コーパス(NPCMJ)チュートリアル

開催日時:2018年10月15日 (月) 10:00~17:20
開催場所:リファレンス駅東ビル(福岡市博多区博多駅東1丁目16-14)
[詳細情報]

2018年6月21日 統語・意味解析コーパス(NPCMJ)チュートリアル

開催日時:2018年6月21日 (木) 15:00-17:00
開催場所:岡山大学 津島キャンパス 情報工学科 工学部4号館103号室
https://www.okayama-u.ac.jp/tp/access/access_4.html
参加申込:どなたでも参加可能ですが、参加人数を確認するため、事前にn.nomura[at]ninjal.ac.jp 宛にお申し込みください。

※ 当日は各自PCをご持参ください。

プログラム
  • 吉本啓 「コーパス構築の理念、コーパスの収録テキストの概要」
  • 長崎郁 「ウェッブ・インターフェースの概要、文字列検索」
  • スティーブン ライト ホーン 「データのスキーマ、ツリー検索の言語 Tgrep-lite」
  • 鈴木彩香 「ローカル環境ツールの活用法、Tregex とTsurgeon」
2017年11月4日 統語・意味解析コーパス(NPCMJ)チュートリアル

開催期日:2017年11月4日 (土)
開催場所:神戸大学人文学研究科A棟1階学生ホール
http://www.lit.kobe-u.ac.jp/information/access.html
参加申込:どなたでも参加可能ですが、参加人数を確認するため、事前に a-ueki[at]ninjal.ac.jp 宛にお申し込みください。

13:45-14:00 講習会受付
14:00-18:00 第2回NPCMJチュートリアル ~NPCMJを利用するための講習会~

講師: Alastair Butler, Stephen Horn and Iku Nagasaki (NINJAL)
※日本語で行います。

2017年11月1日 統語・意味解析コーパス(NPCMJ)チュートリアル

開催日時:2017年11月1日 (水) 16:30 – 18:30
開催場所:お茶の水女子大学理学部3号館 ラウンジ (2F) (地図の20番の建物)
http://www.ocha.ac.jp/en/access/index.html
参加申込:どなたでも参加可能ですが、参加人数を確認するため、事前に a-ueki[at]ninjal.ac.jp 宛にお申し込みください。

講師: Alastair Butler, Stephen Horn and Iku Nagasaki (NINJAL)
※日本語で行います。

今回の講習会では、データの概要、インターフェースの使い方、検索結果のダウンロードとローカル環境での利用を扱います。

当日、インターネット接続機器とPCをご持参いただけると、実際の操作を体験できます。

2017年7月6日 統語・意味解析コーパス(NPCMJ)チュートリアル

開催期日:2017年7月6日 (木)
開催場所:慶應義塾大学