第(2/3)页 当然了,12306毕竟不是一般BBS论坛,把这个作为初学者的练习目标,还是有不小难度的。 不过也仅仅是不小而已,对于已经吃透了整本书的陆学霸来说,问题却是不大。爬虫本身并没有太高的技术难度,不到30行代码就搞定了整个程序,完美运行无bug。 然后紧接着就是抓取了。 将网站的url复制在代码后面,陆舟选择运行,并且将数据生成表格,导入到预先建好的文件夹中。 紧接着机箱的风扇开始嗡嗡作响,电脑变的卡顿起来,一行行编码从黑色的对话框中闪过,被迅速整理进表格中。 看着不断被填充的文件夹,靠在椅子上的陆舟心中感慨。 “python语言真尼玛方便,难怪那么多大牛推荐这玩意儿。” 看着一行行数据闪过的信息,陆舟还真有种过把黑客瘾的错觉。 不过当然了,也仅仅是错觉而已,连感觉都谈不上,毕竟这玩意儿和黑客技术完全八竿子打不着边。从服务器上爬取公开信息是不犯法的,顶多有挤占别人服务器资源的嫌疑,会被各大站长痛恨不已。 所以很多“小气”的网站会设置有反爬虫程序,技术高点的要么让你什么东西都爬不到,要么爬下来的都是乱码,技术含量低的也可以通过访问次数监控,直接锁了你的ip。 不过12306网站显然没那么小气,想想一个连用户体验都不在意的垄断巨头,会在意那点服务器资源?只要你们别把老子的服务器折腾扑街了,谁管你! 看着文件夹里不断堆积的车次数据,陆舟眼睛转了转,寻思着要不要用它来干点啥? “做个订车票网站?好像有些脱了裤子放屁……” 忽然,陆舟心中一动。 要不…… 做个网上订票的app? 这个临时起意的想法一冒出来,便不可控制地在他心中生根发芽。 虽然网络上有不少第三方订票app,但官方的订票app还真没有。如果他能做出来一个与众不同的,卖给那些感兴趣的运营商,说不定还能赚点生活费。 一涉及到钱的问题,陆舟顿时就上心了,心中开始不断盘算了起来。 技术上,独立完成一个app从前端到后端的开发,难度很高,远非写一个简单的爬虫程序能相提并论,不过却并非无法完成。更何况,解决不了的算法还能问系统嘛,消耗积分查询资料本身也是一个学习的过程。 等他完成了奖励任务,解锁了人工智能LV0这一分支科技,这些宝贵的经验肯定能派上用场。 第(2/3)页