文件名称:
news_crawler:新闻搜寻器-源码
开发工具:
文件大小: 10kb
下载次数: 0
上传时间: 2021-03-22
详细说明:新闻网站数据爬取和分析
实现了Chinadaily上特定关键字(COVID-19)相关新闻的爬取和数据分析,可以修改现有代码爬取和分析其他新闻网站。
使用说明
初步步骤
检查python安装成功,可以控制台(cmd)中输入python --version,如果输出版本号,说明安装成功了。
在cmd中执行:
pip3安装numpy matplotlib枕头wordcloud imageio jieba snownlp itchat请求
到此,软件安装完成。
使用
数据爬取
执行
刮y的中国日报
会在工程目录下生成一个covid-19.html,里面包含了标题和内容。数据量比较大,执行的时候会一直控制台刷新消息,等待即可。
数据可视化
执行
python scrapy.py
可以生成词云图片
代码修改
主要修改爬虫下的chinadaily.py文件,修改爬取的URL和parse()函数中的解
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.