12306 网站的根目录下为什么连 robots.txt 文件(反爬虫协议)都没有?_贵州省毕节市赫章县证祥阶专业咨询有限公司

12306 网站的根目录下为什么连 robots.txt 文件(反爬虫协议)都没有?

后台-模块-广告管理-内容头部广告位
后台-模块-广告管理-内容头部广告位

你当然可以爬12306。

要不携程飞猪去哪网这些的数据是哪来的。

这种爬虫反而给12306省流量。

因为如果没有第三方网站,所有查火车信息的流量(哪怕不买票)就都得是12306接收。

而这些网站虽然在抢票的时候会浪费一些流量(卡放票时间反复刷票),但是如果有人只查票不买票,则对12306的流量消耗为0。

不过你要是一天爬它几亿次,就别怪晶哥抓你了。

12306 网站的根目录下为什么连 robots.txt 文件(反爬虫协议)都没有?

吉-ICP备47941419号-1|网站地图
本文地址:
吉-ICP备47941419号-1|网站地图本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
后台-模块-广告管理-内容底部广告位
后台-模块-广告管理-内容底部广告位

上一篇 : 为什么不用rust重写Nginx?

上一篇 : 为什么不用rust重写Nginx? "> 条评论)

快来评论,快来抢沙发吧~