wget

機能

インターネット上のリソースの取得

起動方法

    wget [options] URL1 [URL2...]

機能

インターネット上などにあるリソース(HTMLファイル, 画像・音声データ他)をローカルにコピーする。
あるサイトのデータをまとめてコピーしたい時に便利である。
収集されたファイルは、コマンドが実行されたディレクトリの下のURLの名前のディレクトリにコピーされる。

オプション

-A | --accept pattern
収集するファイルのパターン(pattern)を決める。
複数のパターンは,(コンマ)で区切る。
-I | --include directory
収集するディレクトリ(directory)を決める。
複数のパターンは,(コンマ)で区切る。
-L | --relative
相対パスで記されているファイルのみ取得。
-N | --timestamping
日付を見て、古いタイムスンタプのものは取らない。
--no-parent
親ディリクトリにはたどらない
-O filename | --output-document=filename
アウトプットファイル名。
-P prefix | --directory-prefix=prefix
保存するローカルのディリクトリ。
-Q quota[KM] | --quota=quota[KM]
ダウンロードする最大のサイズ(K - Kbyte, M - Mbyte )
-R | --reject pattern
収集しないファイルのパターン(pattern)を決める。
複数のパターンは,(コンマ)で区切る。
-X | --exclude directory
収集しないディレクトリ(directory)を決める。
複数のパターンは,(コンマ)で区切る。
-nH
ホスト名のディリクトリは作らない。
-nd
ディリクトリ構造を作らず、カレントディレクトリないしは-Pで指定した ディレクトリにすべてのファイルを保存。同名のものは.nが付けられる。
-np | --no-parent
指定したURLより上のディレクトリは収集しない。
-i | --input file
ファイル(file)に書いてあるURLを収集する。
ファイルには複数のURLを並べておくことができる。
-k | --convert-links
絶対パスを相対パスに直す。
-o filename | --output-document=filename
経過をログファイルfilenameに出力する。
-r | --recursive
再帰的に収集する。
-l | --level level
再帰のレベル(level)を指定する。普通は-rオプションと併用する。

ファイル

~/.wgetrc
スタートアップファイル

環境変数

WGETRC
スタートアップファイルのファイル名

使用例

以下の使用例では、コピーされてきたデータはwgetを実行したディレクトリに作られる www.haha.comの下にコピーされる。

# wget http://www.haha.com/           <- http://www.haha.com/index.html をコピーする
# wget -r -l 5 http://www.haha.com/   <- http://www.haha.com/index.html から
                                         再帰レベル5までのファイルをコピーする 
# wget -r -l 5 -A .html,.txt http://www.haha.com/   <- http://www.haha.com/index.html から
                                         再帰レベル5までのファイル名に.htmlまたは、
					 .txtが含まれるファイルをコピーする 
# wget -r -l 5 -N -nH -A html,gif,jpg -P /home/usr/url/ -I /getdir -X /unget1,/unget2 -L -Q 50k http://www.haha.com/
                                         <- http://www.haha.com/index.html から
                                         再帰レベル5までのファイル名に.htmlと.gifまたは、
					 .jpgが含まれるファイルをコピーする 
					 取得したファイルは/home/usr/urlの下にコピー
					 getdirディレクトリの下のファイルだけコピー
					 unget1,unget2ディレクトリはコピーしない
					 相対パスでリンクしたファイルのみコピー
					 コピーされるサイズの最大は50Kbyte

Home | Contents
Mail