信箱式列表抓取工具
一种从简单URL抓取Letterboxed列表的工具。 输出是一个CSV文件,其中包含电影标题,发行年份,导演,演员,评分(仅适用于个人电影列表),平均评分以及指向“信箱”页面的链接。 当前版本已在监视列表和常规列表上经过测试。 当前的刮擦速度约为每张胶片1.3秒。
入门
依存关系
需要python 3.x,numpy,BeautifulSoup(bs4),请求和tqdm。
正在安装
复制存储库并在其中工作。
执行程序
通过运行python main.py并输入有效的URL(