观鸟者
该存储库包含一组Python工具,这些工具经过开发,可根据用户提供的关键字/短语列表来方便收集实时推文。 该项目围绕Tweepy库构建,旨在收集包含所提供搜索词之一的任何tweet的原始json数据。 api_config.py文件可用于快速生成任何基于tweepy的项目的API对象。 其中包含一个辅助脚本: process_tweets.py ,它将从原始的json twitter数据中快速提取与用户有关的相关信息(以及文本,位置和一些其他键标识符),并将该数据以csv格式存储以供以后