也想出现在这里?联系我们

wordpress禁止恶意HTTP_USER_AGENT,防采集防部分攻击

2014.04.30wordpress教程
  • 文章介绍
  • 升级版本
  • 评价&建议
也想出现在这里?联系我们
也想出现在这里?联系我们

教程介绍

首先我们不得不感谢奶嘴大神给我们带来的精心教程,来自wordpress禁止恶意HTTP_USER_AGENT,防采集防部分攻击的说明,小2觉得很使用,就转载过来了,感谢奶嘴大神为wordpress方面所做出的贡献,怪不得WP.COM要把奶嘴挖去做中国区域的维护人话。。。好啦,下面我们说说今天这个教程的主题内容吧

我们要想知道一个用户的访问意图,可以通过HTTP_USER_AGENT来获取,而一般的正常访客是HTTP_USER_AGENT表示也是很常规的,这里就不说什么了,我们要说的是,哪些HTTP_USER_AGENT是采集软件或者恶意攻击者所具备的标识呢?那么下面的一串代码就可以解决我们的疑惑

  1. $ua = $_SERVER['HTTP_USER_AGENT'];
  2. $now_ua = array('FeedDemon ','ZmEu','Indy Library','oBot','jaunty'); //将恶意USER_AGENT存入数组
  3. if(!$ua) { //禁止空USER_AGENT,dedecms等主流采集程序都是空USER_AGENT,部分sql注入工具也是空USER_AGENT
  4. header("Content-type: text/html; charset=utf-8");
  5. wp_die('请勿采集本站,因为采集的站长木JJ!');
  6. }else{
  7.     foreach($now_ua as $value )
  8.     if(eregi($value,$ua)) {
  9.     header("Content-type: text/html; charset=utf-8");
  10.     wp_die('请勿采集本站,因为采集的站长木JJ!');
  11.     }
  12. }

将上面的代码放到wordpress主题文件夹的functios.php里面,即可,$now_ua里面的数组就代表着目前较为常规的恶意采集软件类的HTTP_USER_AGENT标识!

User Agent公布列表

FeedDemon 内容采集
BOT/0.1 (BOT for JCE) sql注入
CrawlDaddy sql注入
Java 内容采集
Jullo 内容采集
Feedly 内容采集
UniversalFeedParser 内容采集
ApacheBench cc攻击器
Swiftbot 爬虫
YandexBot 爬虫
AhrefsBot 爬虫
YisouSpider 爬虫
jikeSpider 爬虫
MJ12bot 爬虫
ZmEu phpmyadmin漏洞扫描
WinHttp 采集cc攻击
EasouSpider 爬虫
HttpClient tcp攻击
Microsoft URL Control 扫描
YYSpider 爬虫
jaunty wordpress爆破扫描器
oBot 爬虫
Python-urllib 内容采集
Indy Library 扫描
FlightDeckReports Bot 爬虫

大家可以根据上面的User Agent公布列表自由的在代码里拓展所屏蔽的User Agent值!

最后还是感谢奶嘴大神的教程!

2
  • 2014.04.30初次和大家见面了!

已拥有4人对该主题的建议

  1. 4楼
    番号姐:

    代码已使用,希望好使。 感谢博主。

    2015-01-30 下午 10:43 [回复]
  2. 地板
    Era:

    那下面那么多的爬虫,莫非就是恶意采集的ua?

    2014-06-30 下午 5:47 [回复]
  3. 板凳
    zivix:

    😮 有安装super cache的话,木有JJ的页面会被缓存,一般用户查看也是木有JJ哈哈

    2014-06-20 下午 7:18 [回复]
  4. 碉堡了哈~我来关注下了!!

    2014-06-02 上午 9:27 [回复]

发表评论

还能输入240个字

Hi, 欢迎加入Wordpress技术交流群,带你装逼带你飞!

我要入群
也想出现在这里?联系我们
wordpress主题推荐
也想出现在这里?联系我们
wordpress主题站推荐
也想出现在这里?联系我们
wordpress主题站推荐
也想出现在这里?联系我们

我来推荐一个更牛逼的给你看看?

  • 猛戳我吧