搜索资源 - Big_Data_Project-源码

搜索资源列表

Big_Data_Project-源码
大数据项目使用的工具 - Pyspark，SQL 过程 - 数据预处理- 数据集包含FIFA 2019足球运动员的详细信息。预处理包含以下步骤。删除数据集中不必要的列，符号。将值属性转换为浮点值使用nib-max归一化进行特征缩放删除包含空值的行数据分析和数据可视化- 寻找总体球员评级，年龄和球员潜力与每个球员的市场价值之间的相关性。查找具有最大相关性的两列。观察到的最大相关性是针对总体玩家评级和每个玩家的市场价值。绘制总体玩家评分和每个玩家的市场价值以及所需的
所属分类：其它
- 发布日期：2021-03-16
- 文件大小：2097152
- 提供者：weixin_42128393

Big_Data_Project：虚假新闻检测-使用矢量化（例如计数矢量化器，TFIDF矢量化器，哈希矢量化器）进行特征提取。然后使用Ensemble模型对新闻是否为假新闻进行分类-源码
Big_Data_Project-伪造新闻检测在这个项目中，我们展示了使用机器学习算法进行文本分类。我们致力于对给定的新闻文章是假的还是真实的进行分类。数据清理和预处理：删除了文本中的特殊字符拼写检查了所有文档删除了停用词对文档进行矢量化处理。向量化对于矢量化，我们使用了-计数矢量化器，TFIDF矢量化器，哈希矢量化器。分类对于分类目的，我们使用了：多项朴素贝叶斯，支持向量机（LinearSVC），PassiveAgressiveClassifier。我们比较了矢量化器和分类
所属分类：其它
- 发布日期：2021-02-04
- 文件大小：12582912
- 提供者：weixin_42133415