文件名称:
SBIR_TFIDF_KMeans:在小型企业创新研究(SBIR)数据的TFIDF功能上使用KMeans进行文档聚类-源码
开发工具:
文件大小: 2mb
下载次数: 0
上传时间: 2021-03-13
详细说明:Apache Spark中的数据科学
使用TF / IDF-> K均值聚类和LSH(MinHash)
SBIR
语言:Scala和Python
要求:
火花2.x
作者:伊恩·布鲁克斯(Ian Brooks)
关注[LinkedIn-Ian Brooks PhD]( )
源数据
其他信息:小型企业创新研究(SBIR)计划是一项极具竞争力的计划,旨在鼓励国内小型企业从事具有商业化潜力的联邦研究/研究与开发(R / R&D)。 通过基于奖励的竞争性计划,SBIR使小型企业能够发掘其技术潜力,并提供从商业化中获利的动力。 通过将合格的小型企业纳入美国的研发领域,可以刺激高科技创新,并且美国在满足其特定研发需求的同时也将获得企业家精神。
文件上传:将源数据json文件上传到/ tmp目录中的HDFS
链接:
IDF / TF概述:
导入数据-使用提供的Jypter Not
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.