您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 用于SparkStreaming的数据挖掘streamDM.zip

  2. streamDM,是由华为诺亚方舟实验室开源的使用 Spark Streaming 挖掘大数据的开源软件。大数据流学习大数据流学习(Big Data stream learning)比批量或离线学习更富有挑战性,因为数据在流动的过程中不太可能保持同一种分布。而且,数据流中的每一个样本只能被处理一次,否则它们就需要占用内存进行总结,同时该学习算法也必须非常高效。Spark StreamingSpark Streaming 是核心 Spark API 的一个扩展,它能让多个源的数据流处理成为可能。
  3. 所属分类:其它

    • 发布日期:2019-07-19
    • 文件大小:1048576
    • 提供者:weixin_39841856
  1. 聚类算法测试数据集.zip

  2. 本人整理的csv格式的点云数据,可以用来测试和验证k-means、dbscan或者是自己开发的聚类算法。
  3. 所属分类:机器学习

    • 发布日期:2020-08-18
    • 文件大小:217088
    • 提供者:oHanTanYanYing
  1. 雅虎音乐数据集1.0版本yahoo-music.zip

  2. 此数据集是雅虎音乐社区对各种音乐艺术家的偏好的快照。该数据集包含雅虎音乐用户在2004年3月之前的一个月内给予的音乐艺术家超过1000万的收视率。用户被表示为毫无意义的匿名号码,因此不会显示任何识别信息。研究人员可以使用该数据集来验证推荐系统或协作过滤算法。数据集可作为矩阵和图形算法(包括 PCA 和聚类算法)的测试数据。此数据集的大小为 423 MB。
  3. 所属分类:机器学习

    • 发布日期:2021-03-31
    • 文件大小:442499072
    • 提供者:SmartLab307