您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 有关层次聚类算法优秀论文集

  2. 文本聚类是在没有学习的条件下对文本集合进行组织或划分的过程,基本思想是要将相似的文本 划分到同一个类中. 文本聚类技术能够用来发现大规模文本集合的分类体系,以及为文本集合提供一个 概括视图;它在信息自动获取,Web 数据挖掘等领域都有很多的应用。压缩了数十篇基于层次聚类的聚类算法相关论文。
  3. 所属分类:其它

    • 发布日期:2009-12-14
    • 文件大小:5242880
    • 提供者:wuwuinbnu
  1. 哈尔滨工业大学信息检索研究室论文集

  2. Automatic Acquisition of Context-Specific Lexical Paraphrases Shiqi Zhao, Ting Liu, Xincheng Yuan, Sheng Li, and Yu Zhang. ························1 HIT Web based Scoring Method for English Lexical Substitution Shiqi Zhao, Lin Zhao, Yu Zhang, Ting L
  3. 所属分类:其它

    • 发布日期:2010-03-14
    • 文件大小:4194304
    • 提供者:seikou1100
  1. 哈工大信息检索论文集

  2. 基于最大熵分类器的语义角色标注 中文语义角色标注的特征工程 面向变异短文本的快速聚类算法 基于层次聚类的自适应信息过滤学习算法 基于依存分析和错误驱动的中文时间表达式识别
  3. 所属分类:其它

    • 发布日期:2010-11-29
    • 文件大小:4194304
    • 提供者:jujumao2010
  1. 基于层次特征词权重的文本分类方法

  2. 基于层次特征词权重的文本分类方法
  3. 所属分类:专业指导

  1. 基于提取网站层次结构的网页分类方法

  2. 网页自动分类是当前互联网搜索领域一个热点研究课题,目前主要有基于网页文本内容 的分类和基于网页间超链接结构的分类。但是这些分类都只利用了网页的信息,没有考虑到网页所 在网站提供的信息。文中提出了一种全新的对网站内部拓扑结构进行简约的算法,提取网站隐含的 层次结构,生成层次结构树,从而达到对网站内部网页实现多层次分类的目的,并且已经成功应用到 电子商务智能搜索和挖掘系统中
  3. 所属分类:网页制作

    • 发布日期:2011-10-28
    • 文件大小:368640
    • 提供者:duan_123456
  1. Web Data Mining (英文)

  2. 目录回到顶部↑ 第一部分 数据挖掘基础. 第1章 概述3 1.1 什么是万维网3 1.2 万维网和互联网的历史简述4 1.3 web数据挖掘5 1.3.1 什么是数据挖掘6 1.3.2 什么是web数据挖掘7 1.4 各章概要8 1.5 如何阅读本书10 文献评注10 第2章 关联规则和序列模式12 2.1 关联规则的基本概念12 2.2 apriori算法14 2.2.1 频繁项目集生成14 2.2.2 关联规则生成17 2.3 关联规则挖掘的数据格式19 2.4 多最小支持度的关联规则挖掘
  3. 所属分类:专业指导

    • 发布日期:2012-05-02
    • 文件大小:8388608
    • 提供者:chen_767
  1. 邮件聚合器

  2. 本系统是一个完整的电子邮件客户端,具有许多突出的功能。包括:精确和细致的电子邮件搜索、排序和归类功能。邮件群发管理,多媒体邮件设计制作和多媒体邮件即时展示(包括音频和视频)。 它为用户多邮箱帐户提供单点等录得电子邮件客户端系统。系统的主密钥在本地保存,可方便地让用户为其每个邮箱都设置随机、保密性好以及经常变化的密码,而不需要对它们进行记忆。 把不同的邮箱放在一个统一的虚拟邮件系统中来管理。可对大量邮件进行细致多层次排序、高准确度搜索和动态组织和分类,对其组织结构进行多视角的动态重构。每个电子邮
  3. 所属分类:网管软件

    • 发布日期:2013-01-05
    • 文件大小:25165824
    • 提供者:archymeta_info
  1. 自然语言处理

  2. 为中文自然语言处理而开发的java工具包,也包含为实现这些任务的机器学习算法和数据集.。数据集使用LGPL3.0许可证。 功能 信息检索:文本分类 新闻聚类 中文处理: 中文分词 词性标注 实体名识别 关键词抽取 依存句法分析 时间短语识别 结构化学习:在线学习 层次分类 聚类 精确推理
  3. 所属分类:Java

    • 发布日期:2013-03-14
    • 文件大小:36700160
    • 提供者:huangyuu5
  1. 提出在缩小层次文本分类法中利用全局信息局限性的外部方法

  2. 将文档归入大规模的网络分类法中是一项具有挑战性的研究问题,因为在分类法中存在大量的类别和相关文档。最先进的解决方案被称为narrow-down方法,它利用搜索引擎将整个类别层次结构减小到最相关的类别,并使用分类法选择其中最好的。在最近的语言建模方法中,顶级类别信息(或全球信息)被用于判断本地类别的恰当性,这使得性能得到了提升。然而,我们观察到,在一定条件下,使用全局信息在最终的类别选择上会产生限制性的影响。首先,尽管全局信息是由一个完整的层次结构的顶级类别分类产生的,但可能也是不准确的。第二,
  3. 所属分类:其它

    • 发布日期:2014-12-30
    • 文件大小:2097152
    • 提供者:qq_24931595
  1. 层次文本分类

  2. 层次文本分类,基于中图法实现文献的分类方法
  3. 所属分类:其它

    • 发布日期:2016-02-18
    • 文件大小:8388608
    • 提供者:u010200379
  1. 卷积神经网络

  2. 卷积神经网络层次结构;字符级卷积神经网络和其他算法在文本分类上的比较。
  3. 所属分类:讲义

    • 发布日期:2017-02-21
    • 文件大小:2097152
    • 提供者:abrohambaby
  1. 大规模层次分类问题研究及其进展

  2. 大规模层次分类问题研究如何将互联网上的网页文档准确地分到类别层次中的各个类别.该文对大规模层次分类问题进行了分析.首先,给出了大规模层次分类问题的定义,分析了大规模层次分类问题的求解策略;其次,对大规模层次分类问题的求解方法加以分类,在分类基础上,介绍了各种典型的求解方法并进行了对比;最后总结了各种大规模层次分类问题求解方法并指出了未来的研究方向.
  3. 所属分类:算法与数据结构

    • 发布日期:2018-09-03
    • 文件大小:719872
    • 提供者:heavenkitty
  1. 基于文本挖掘的中文定量文体特征分析

  2. 在本文中,选择数据挖掘来检查是否存在某种语言学以词性(POS)为例的功能可以用作中文量化风格特征。 也可以说本文的目的是探索确定中文定量文体特征的方法。 课文新闻,科学,官方,艺术,电视对话以及选择日常会话方式以建立我们研究的语料库。 文本用主成分分析法分析了以POS为特征的向量。 通过聚集层次聚类方法聚类。 他们的结果表示POS可以用作文本的独特功能。 然后,支持采用矢量机建立训练数据分类模型, 精度和召回率,以验证文本分类的结果。 随机的选择森林来计算POS的重要性,即对POS的贡献分类,并
  3. 所属分类:其它

    • 发布日期:2021-03-10
    • 文件大小:337920
    • 提供者:weixin_38564003
  1. 基于阻塞先验知识的文本层次分类模型

  2. 基于阻塞先验知识的文本层次分类模型
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:593920
    • 提供者:weixin_38605590
  1. 基于语义的文本流形研究

  2. 本文通过引入包括Isomap 流形降维、查询语义词典(WordNet) 等高度非线性的方法,期望将文本信息处理领域长期专注于“语法”层次的研究,演进到“语义”的层次. 利用流形学习工具研究了中文词汇在语义空间(分类空间) 的分布聚集情况,通过利用WordNet 词典进行了短信聚类的研究. 实验结果表明,本文的方法能够更好地反映文本之间的内在联系.
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:385024
    • 提供者:weixin_38746293
  1. discord-rp-novelizer:一个Python程序,用于获取从rp服务器生成的文本文件并进行组织-源码

  2. 不和谐rp新颖剂 一个Python程序,用于获取从rp服务器生成的文本文件并对其进行组织。 如何使用 使用获取所需频道的CSV文件。 下载Novelizer.py并使用首选的Python编辑器将其导入到文件中。 创建一个Novelizer对象。 在每个CSV文件中使用read_in(r“ your file path”)读取。 这将打印频道名称和消息数。 或read_in_from_folder_of_DCE_csv(r“文件夹路径”)。 确保层次结构中的每个文件都采用正确的格式! 从d
  3. 所属分类:其它

    • 发布日期:2021-02-13
    • 文件大小:4096
    • 提供者:weixin_42110070
  1. keras-text:Keras中的文本分类库-源码

  2. Keras文本分类库 keras-text是一站式的文本分类库,可通过干净且可扩展的界面实现各种最新模型,以实现自定义架构。 快速开始 创建一个标记器以建立您的词汇表 要将您的数据集表示为(docs, words)使用WordTokenizer 要将您的数据集表示为(docs, sentences, words)使用SentenceWordTokenizer 要创建任意层次结构,请扩展Tokenizer并实现token_generator方法。 from keras_text . pro
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:11534336
    • 提供者:weixin_42110469
  1. texar-pytorch:将TF的最佳功能集成到PyTorch中,用于机器学习,自然语言处理和文本生成。 这是CASL项目的一部分:http:casl-project.ai-源码

  2. Texar-PyTorch是一个工具包,旨在支持广泛的机器学习,尤其是自然语言处理和文本生成任务。 Texar提供了易于使用的ML模块和功能库,用于组成任何模型和算法。 该工具是为研究人员和从业人员设计的,用于快速原型制作和实验。 Texar-PyTorch最初开发,由和与其他研究所合作积极贡献。 维护此存储库的镜像。 Texar-PyTorch将TensorFlow的许多最佳功能集成到PyTorch中,提供了优于PyTorch本机模块的高度可用和可定制的模块。 主要特点 两种版本,(大多数)
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:1048576
    • 提供者:weixin_42168555
  1. 基于启发式规则和SVM的自然场景中文文本定位

  2. 为了实现自然场景下的中文文本定位,设计实现了一种启发式规则过滤和SVM精确分类的层次定位方法。首先通过最大稳定极值算法提取区域,对于汉字笔画分离的问题,用形态学运算进行笔画融合。再根据汉字的特点,设计启发式规则过滤非文本区域,其中通过候选字符区域的椭圆拟合,引入椭圆的偏心率作为文本判别规则。最后提取HOG特征,通过SVM精确分类实现文本定位。实验证明本文方法在复杂的自然场景下取得了良好的文本定位效果。
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:883712
    • 提供者:weixin_38645266
  1. 基于特征融合的层次结构微博情感分类

  2. 情感分类是观点挖掘的热点研究之一,微博文本情感分类具有很高的应用价值。鉴于传统特征选择方法存在语义缺陷,采用神经网络语言模型,提出了基于概率模型的对词向量进行权重分配的深层特征表示方法,构建文本语义向量。将文本深层特征与浅层特征融合,构建融合语义信息的特征向量,弥补传统特征选择方法语义的缺陷。采用SVM层次结构分类模型,实现多种情感分类。实验结果表明,采用特征融合的层次结构情感分类方法,能有效提高微博情感分类的准确率。
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:1048576
    • 提供者:weixin_38603259
« 12 3 4 5 6 7 8 »