wget
機能
インターネット上のリソースの取得
起動方法
wget [options] URL1 [URL2...]
機能
インターネット上などにあるリソース(HTMLファイル, 画像・音声データ他)をローカルにコピーする。
あるサイトのデータをまとめてコピーしたい時に便利である。
収集されたファイルは、コマンドが実行されたディレクトリの下のURLの名前のディレクトリにコピーされる。
オプション
- -A | --accept pattern
- 収集するファイルのパターン(pattern)を決める。
複数のパターンは,(コンマ)で区切る。
- -I | --include directory
- 収集するディレクトリ(directory)を決める。
複数のパターンは,(コンマ)で区切る。
- -L | --relative
- 相対パスで記されているファイルのみ取得。
- -N | --timestamping
- 日付を見て、古いタイムスンタプのものは取らない。
- --no-parent
- 親ディリクトリにはたどらない
- -O filename | --output-document=filename
- アウトプットファイル名。
- -P prefix | --directory-prefix=prefix
- 保存するローカルのディリクトリ。
- -Q quota[KM] | --quota=quota[KM]
- ダウンロードする最大のサイズ(K - Kbyte, M - Mbyte )
- -R | --reject pattern
- 収集しないファイルのパターン(pattern)を決める。
複数のパターンは,(コンマ)で区切る。
- -X | --exclude directory
- 収集しないディレクトリ(directory)を決める。
複数のパターンは,(コンマ)で区切る。
- -nH
- ホスト名のディリクトリは作らない。
- -nd
- ディリクトリ構造を作らず、カレントディレクトリないしは-Pで指定した
ディレクトリにすべてのファイルを保存。同名のものは.nが付けられる。
- -np | --no-parent
- 指定したURLより上のディレクトリは収集しない。
- -i | --input file
- ファイル(file)に書いてあるURLを収集する。
ファイルには複数のURLを並べておくことができる。
- -k | --convert-links
- 絶対パスを相対パスに直す。
- -o filename | --output-document=filename
- 経過をログファイルfilenameに出力する。
- -r | --recursive
- 再帰的に収集する。
- -l | --level level
- 再帰のレベル(level)を指定する。普通は-rオプションと併用する。
ファイル
- ~/.wgetrc
- スタートアップファイル
環境変数
- WGETRC
- スタートアップファイルのファイル名
使用例
以下の使用例では、コピーされてきたデータはwgetを実行したディレクトリに作られる
www.haha.comの下にコピーされる。
# wget http://www.haha.com/ <- http://www.haha.com/index.html をコピーする
# wget -r -l 5 http://www.haha.com/ <- http://www.haha.com/index.html から
再帰レベル5までのファイルをコピーする
# wget -r -l 5 -A .html,.txt http://www.haha.com/ <- http://www.haha.com/index.html から
再帰レベル5までのファイル名に.htmlまたは、
.txtが含まれるファイルをコピーする
# wget -r -l 5 -N -nH -A html,gif,jpg -P /home/usr/url/ -I /getdir -X /unget1,/unget2 -L -Q 50k http://www.haha.com/
<- http://www.haha.com/index.html から
再帰レベル5までのファイル名に.htmlと.gifまたは、
.jpgが含まれるファイルをコピーする
取得したファイルは/home/usr/urlの下にコピー
getdirディレクトリの下のファイルだけコピー
unget1,unget2ディレクトリはコピーしない
相対パスでリンクしたファイルのみコピー
コピーされるサイズの最大は50Kbyte
Home | Contents
Mail