如何用wget下载文件?利用wget整站下载的基本实用技巧
发布于 作者:苏南大叔 来源:程序如此灵动~大家已经知晓了在各个主流操作系统中,如何下载安装wget
。那么在本文中,苏南大叔要继续探讨的是:wget
的基本使用问题。为什么wget
的使用,这么简单的问题会单列出一篇文章。那是因为,wget
有一个参数-mpk
,那是无比强大。苏南大叔觉得还是有必要单独说明一下比较好。
再次介绍一下wget
的基本功能:
wget命令用来从指定的URL下载文件。wget非常稳定,它在带宽很窄的情况下和不稳定网络中有很强的适应性,如果是由于网络的原因下载失败,wget会不断的尝试,直到整个文件下载完毕。如果是服务器打断下载过程,它会再次联到服务器上从停止的地方继续下载。这对从那些限定了链接时间的服务器上下载大文件非常有用。
如果您还没有安装wget
工具,可以参考一下下面这篇文章:
wget
的基本参数
大家可以使用下面的命令,来查看相关的选项。
wget --help
这里苏南大叔找了点中文的文字说明,当然,参数并不完整不。但是因为大多数功能,基本上大家也用不到。基础使用已经足够了。
-a<日志文件>:在指定的日志文件中记录资料的执行过程;
-A<后缀名>:指定要下载文件的后缀名,多个后缀名之间使用逗号进行分隔;
-b:进行后台的方式运行wget;
-B<连接地址>:设置参考的连接地址的基地地址;
-c:继续执行上次终端的任务;
-C<标志>:设置服务器数据块功能标志on为激活,off为关闭,默认值为on;
-d:调试模式运行指令;
-D<域名列表>:设置顺着的域名列表,域名之间用“,”分隔;
-e<指令>:作为文件“.wgetrc”中的一部分执行指定的指令;
-h:显示指令帮助信息;
-i<文件>:从指定文件获取要下载的URL地址;
-l<目录列表>:设置顺着的目录列表,多个目录用“,”分隔;
-L:仅顺着关联的连接;
-r:递归下载方式;
-nc:文件存在时,下载文件不覆盖原有文件;
-nv:下载时只显示更新和出错信息,不显示指令的详细执行过程;
-q:不显示指令执行过程;
-nh:不查询主机名称;
-v:显示详细执行过程;
-V:显示版本信息;
--passive-ftp:使用被动模式PASV连接FTP服务器;
--follow-ftp:从HTML文件中下载FTP连接文件。
默认的基本下载操作姿势
下面的命令,保存成了 index.html
文件。
wget http://www.baidu.com
下面的命令,保存成了 guonei
文件。
wget -O guonei.html http://news.baidu.com/guonei
如果没有指定输出文件名的话,就会以最后一个/
后面的字符,作为文件名。这样的话,很多时候,都是不正常的。所以,有了这个参数-O
,可以自己指定一个输出文件名,注意是大写的欧。
镜像网站功能
这个功能就非常厉害了,可以下载一个网站,而且还会自动修复相关的链接及资源的路径(但是,有修错了的概率...)。
当然,这个参数组合还有很多种表述方式,大家可以参考帮助信息。
总结
wget
的参数实在是太多了,如果一个一个实验的话,估计要连载几周。不过,因为大多数情况下,也不会用到这些高大上的参数,苏南大叔这里就抛砖引玉了。大家想知道更多的话,请wget --help
一下,你就知道了。
更多wget
的经验文字,请点击下面的链接查看。
本博客不欢迎:各种镜像采集行为。请尊重原创文章内容,转载请保留作者链接。
看看~试试
看看~