这篇单纯为了纪念一下自己的第一份爬虫代码,诶,学习过程属实不易!中途一直被弹幕输出格式为\xe7\x8e\x8b\xe8\x80\x85\xe5\x86\x9c\xe8\x8d\xaf……的bytes形式(也是网上搜了才晓得 诶…)的字符串给整自闭了,后来找了老久终于发现了 str.encode(“raw_unicode_escape”).decode() 这个神奇的代码,可将此str转化为bytes, 再decode转为str,这样便能输出正常的字符串了!
下面附上源码(第一次写可能还有很多需