系列文章将记录本人从零开始搭建资讯类的网站,所有源码都开放哦!欢迎互相讨论学习!
源码下载地址:https://github.com/wuqiwenpk/babyteach
本系列文章导航:https://github.com/wuqiwenpk/babyteach/blob/master/README.md
本篇目的
通过爬虫爬取同类资讯网站新闻详情页,并保持内容到数据库中。
本次爬虫测试目标为
列表页:http://www.yuerzaixian.com/a/1171.aspx
爬取详情页: