apache使用.htaccess文件实现屏蔽wget下载网站内容

发布时间:2021-09-12

  wget是一个从网络上自动下载文件的自由工具,支持通过HTTP、HTTPS、FTP三个最常见的TCP/IP协议下载,并可以使用HTTP代理。wget名称的由来是“World Wide Web”与“get”的结合。

  

  经发现,虽然wget遵循 robots.txt 规则,www.lu0.com但是那个还是可以绕过去,现在把我自己使用的屏蔽方法分享给大家:

  1. 屏蔽下载任何文件

  .htaccess

  123456SetEnvIfNoCase User-Agent ^wget bad_bot<Limit GET POST>Order Allow,DenyAllow from allDeny from env=bad_bot</Limit>2. 屏蔽下载部分文件

  .htaccess

  12345678SetEnvIfNoCase User-Agent ^Wget bad_botSetEnvIfNoCase User-Agent ^Wget/1.5.3 bad_botSetEnvIfNoCase User-Agent ^Wget/1.6 bad_bot<Files ~ .(htmlpdfmp3ziprarexegifjpe?gpngphpjsp) $>Order Allow,DenyAllow from allDeny from env=bad_bot</files>

注册即送1000元现金券