最近和朋友一起开发APP,需要大量数据,而”互联网”与”共享”融合发展的理念,遂资源的可重用给予了当代骚客文人获得感与幸福感…好了,不日白了(正宗重庆话,吹牛的意思),开始正题
BeautifulSoup4
本人是做JavaWeb的,可能多多少少还是遗留了Java的一些格式及规范,但爬虫千千万,却是Python最好使
Beautiful Soup4作为HTML/XML的解析器,其使用、解析难度都较为简单;
人性化的API,支持 lxml 的 XML解析器;
同样也支持CSS选择器、Python标