小议“模拟浏览器行为”实现的可能性(超级菜鸟慎进)
前记:
1、说“世界很大”,是么?通过网络可以让你认识很多外国友人。
2、说“世界很小”,是么?也许有些东西,你等待了很久也没有踪迹~
正文:
最近一直感叹人的能力有限,电脑可以实现很多东西的自动化,使问题得到更好的实现和解决。使人们从枯燥无味的一些行为中解脱出来。
而“互联网”这个东东也是现在大家不能不面对的事情。想在这方面做更多更好的事情,就必须你更好的掌握这个东西的最新动向,用很好的利器来驾驭他。
本文就这个角度说说一些现象。
1、模拟浏览现象举例说明
最近我的浏览监控记录记录到一些外国网站的http_referer,而普通意义上如果能记录到这些记录的话,说明他们的网站做了连接过来给你。
但是我过去浏览了一下,绝对没有相关的记录,也许有人说,也许是个类似抓虾的rss呢。(参见《难道抓虾网的人认识我么?》,就目前情况看,答案是“不是”,这些refer的记录时间很接近,虽然ip不同,但是可以推测是一个人所为,可能他用了超级代理。(参见《什么叫“超级匿名”“普通匿名”和“透明代理”》),并采用了轮换机制。
虽然不明白他的目的是如何,但是目前要对“他”(虽然不知道是那个)的行为保持关注。(相关的refer及ip暂时保密),目前他的行为还是比较神秘,因为他不但轮换ip,还伪造referer,并且隐藏了userlang参数。很神秘,不能排除他是自动机器人或者网络爬虫的可能性。
2、实现的技术手段小窥
其实,浏览器(ie)只是一个客户和服务器交换信息的手段,在交换的时候,浏览器在请求地址url的同时,同时发送了一些附加的数据包,如useragent,ip,userlang等等,而服务器返回的值中也有附加值,比如steamtype,pageencoding等。
而这些信息其实是可以伪造的,就是说不由浏览器来发送,而是通过一些其他的工具来实现,而服务器的返回值及附加包,也是可以用其他的方式来阐释的,比如直接阐释成字符串等等。有如黑客界的大名鼎鼎的“nc军刀”,其主要原理就是抓cookie,然后模拟提交并获得返回值。
而这些信息不伪造,其实也是可以做到模拟浏览的。举例现在的各种浏览器插件(网络实名,百度搜霸等)或者流行的浏览器病毒等。实现的过程都是对浏览器进行劫持,插入到浏览器的进程中,对服务器的返回值进行按照软件的意愿进行处理。当然这个处理就可以是好的,也可以是坏的了。呵呵。那么可以利用js+html对当前页面进行改造,使其实现一定的功能,比如自动填表,或者自动提交(可以用来做灌水机等,哈哈)等等。
3、一些更多的发散思维
高中政治学中曾经有个有个“生产一件物品所需要的必要劳动时间决定其价值”的话,目前这些软件的泛滥也许将导致一些互联网灾难的发生。比如现在的各种im软件的信息自动发送软件的日益泛滥….
4、一句话总结
互联网是个充满财富的双刃剑,小心的去发掘它吧。that’s
all~~~ 
本文来自苏南的博客, 转载请注明网址:http://newsn.net, 谢谢!
我的淘宝小店:http://68zz.com
我的Sina圈子:http://q.blog.sina.com.cn/pctalk
