本文实例讲述了python使用BeautifulSoup分析网页信息的方法。分享给大家供大家参考。具体如下:
这段python代码查找网页上的所有链接,分析所有的span标签,并查找class包含titletext的span的内容
复制代码 代码如下:#import the library used to query a website
import urllib2
#specify the url you want to query
url = “http://www.python.org”
Python爬虫学习记录(1)——BeautifulSoup爬取天气信息
上节学习了flask简单使用并且爬取网站,本节学习BeautifulSoup爬取天气信息
打开网站:http://www.weather.com.cn/weather/101030100.shtml 可以看到天津天气七天信息
查看网页源代码:分析一天的天气标签 ul li h1 p span i win
下面开始编写代码:
BeautifulSoup的详细使用方法就不再介绍网上应该有很多,这里只针对本练习使用。
1.