FrontPage

Tools

extract_heritrix.pl

name

extract_heritrix.pl - extract HTML contents from a Heritrix Archive file.

usage:

perl extract_heritrix.pl INPUT_ARCFILE LOGFILE OUTPUT_DIR DATE_STR


example:

  % perl extract_heritrix.pl \
          IAH-20051128151845-00000-fraublucher.sslmit.unibo.it.arc \
          test.log \
          RESULT \
          200511

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2019-03-15 (金) 12:41:50