您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于Hadoop平台的海量文本分类的并行化

  2. 基于Hadoop平台的海量文本分类的并行化 的论文,主要是基于TFIDF理论进行文本分类在hadoop平台的实现方式进行说明,有一定的参考价值
  3. 所属分类:其它

    • 发布日期:2013-07-20
    • 文件大小:473088
    • 提供者:hyhongyong
  1. 基于并行计算的文本分类技术

  2. 针对传统文本分类方法对于海量数据分类速度慢精度差等问题,将并行计算应用到文本分类领域,设计了一套基于MapReduce的并行化文本分类框架,结合Bagging算法思想提出了支持向量机的并行训练方法,并在Hadoop云计算平台上进行了实验,实验结果表明该分类方法具有较快的分类速度和较高的分类精度。
  3. 所属分类:算法与数据结构

    • 发布日期:2018-06-30
    • 文件大小:372736
    • 提供者:qq_28339273
  1. 基于大数据平台构建数据仓库的研究与实践.pdf

  2. 数据仓库设计文档,帮助大家理解及如何设计数据仓库,很不错的一篇论文。专题 lTo 学习体系,能从海量数据中提炼高价值信息,构建自主 (1)源系统结构化数据:源系统按大数据平合的 训练与反馈、可不断从最新数据中调整演化的智能业务供数规范要求提供表数据文本和标志文件。 模型体系。 (2)文件交换区FSA:文件的交换中枢,含源系 以 Hadoop^ Spark为代表的大规模数据处理技术为统结构化数据和半结构化、非结构化数据(主要是外部 超越传统数据库的处理局限性提供了先进的并行计算和数据)。 资源调度
  3. 所属分类:其它

    • 发布日期:2019-07-16
    • 文件大小:1048576
    • 提供者:bucaixia08
  1. 基于Hadoop的C4.5决策树分类算法并行化

  2. 通过研究各种决策树分类算法的并行方案后,并行设计C4.5算法。同时根据Hadoop云平台的MapReduce编程模型,详细描述C4.5并行算法在MapReduce编程模型下的实现及其执行流程。最后,对输入的海量文本数据进行分类,验证了算法的高效性和扩展性。
  3. 所属分类:其它

    • 发布日期:2020-10-17
    • 文件大小:285696
    • 提供者:weixin_38616033
  1. 基于Hadoop平台的海量文本分类的并行化

  2. 文本分类是信息检索与数据挖掘的研究热点与核心技术,近年来得到了广泛的关注和快速的发展.近来年随着文本数据呈指数增长,要有效地管理这些数据,就必须在分布式环境下用有效的算法来处理这些数据.在Ha-doop分布式平台下实现了一简单有效的文本分类算法——TFIDF分类算法,即一种基于向量空间模型的分类算法,它用余弦相似度得到分类结果.在两个数据集上做了实验,结果表明,这一并行化算法在大数据集上很有效并可以在实际领域中得到良好的应用.
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:660480
    • 提供者:weixin_38727453