您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 八斗大虚据第九期完整版.docx

  2. 一阶段:这一阶段会学习MapReduce、Hive、HDFS、Yarn、Spark等计算框架的开发技术,以及Scala编程语言。通过项目实践,你能快速掌握这些技术,获得数据开发、数据挖掘、机器学习等职位必备的基本开发能力。 第二阶段:这一阶段会学习FLume、Kafka、Spark Streaming、Flink/Storm、Zookeeper、HBase等计算框架的开发技术,以及大数据体系内的数据采集和数据仓库理论思想和技术实现。通过项目实践,你能快速掌握这些技术,获得完整的大数据架构开发能
  3. 所属分类:Hadoop

    • 发布日期:2019-07-24
    • 文件大小:12288
    • 提供者:qq_43648927
  1. 中文分词算法.docx

  2. 1、颗粒度越大越好:用于进行语义分析的文本分词,要求分词结果的颗粒度越大,即单词的字数越多,所能表示的含义越确切,如:“公安局长”可以分为“公安 局长”、“公安局 长”、“公安局长”都算对,但是要用于语义分析,则“公安局长”的分词结果最好(当然前提是所使用的词典中有这个词)
  3. 所属分类:Java

    • 发布日期:2020-04-17
    • 文件大小:18432
    • 提供者:qq_41936098
  1. 八斗大数据-第九期.docx

  2. 1.包含MapReduce、Hive、HDFS、Yarn、Spark等计算框架的开发技术,以及Scala编程语言。 2.包含FLume、Kafka、Spark Streaming、Flink/Storm、Zookeeper、HBase等计算框架的开发技术。 3.包含NLP文本相似度、中文分词、HMM算法、推荐算法CF、回归算法等。 特点: 1.完整版,有实践 2.链接有效 3.有预习的录播课程
  3. 所属分类:Hadoop

    • 发布日期:2020-01-10
    • 文件大小:12288
    • 提供者:u014299058