您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. LJCluster文本聚类技术中间件

  2. 文本聚类是基于相似性算法的自动聚类技术,自动对大量无类别的文档进行归类,把内容相近的文档归为一类,并自动为该类生成特征主题词。适用于自动生成热点舆论专题、重大新闻事件追踪、情报的可视化分析等诸多应用。 灵玖Lingjoin(www.lingjoin.com)基于核心特征发现技术,突破了传统聚类方法空间消耗大,处理时间长的瓶颈;不仅聚类速度快,而且准确率高,内存消耗小,特别适合于超大规模的语料聚类和短文本的语料聚类。 灵玖文档聚类组件的主要特色在于: 1、速度快:可以处理海量规模的网络文本数据,
  3. 所属分类:网络基础

    • 发布日期:2010-03-09
    • 文件大小:1048576
    • 提供者:lingjoin
  1. 哈尔滨工业大学信息检索研究室论文集

  2. Automatic Acquisition of Context-Specific Lexical Paraphrases Shiqi Zhao, Ting Liu, Xincheng Yuan, Sheng Li, and Yu Zhang. ························1 HIT Web based Scoring Method for English Lexical Substitution Shiqi Zhao, Lin Zhao, Yu Zhang, Ting L
  3. 所属分类:其它

    • 发布日期:2010-03-14
    • 文件大小:4194304
    • 提供者:seikou1100
  1. 基于CRFs 的中文分词和短文本分类技术.pdf

  2. 本文的工作主要包括两部分:第一部分,我们借用了文本分类领域的特征选择算法对中文分词中的特征进行分析。分析结果表明,特征选择算法在中文分词的任务中也是适用的。在中文分词领域,基于字标注的方法得到广泛应用。通过字标注系统,中文分词任务被转换为序列标注任务,许多成熟的机器学习算法得以应用。评测结果表明,在众多的机器学习算法中,基于CRFs的分词器可以达到state-of-the-art的分词效果。CRFs分词器对于给出的每一个切分,都可以提供置信度。在本文中,我们深入调研了CRFs提供的置信度,在此
  3. 所属分类:其它

    • 发布日期:2011-01-04
    • 文件大小:1048576
    • 提供者:chwbin
  1. 短文本分析

  2. libshorttext-1.1.tar.gz 短文本分析
  3. 所属分类:IT管理

    • 发布日期:2014-04-22
    • 文件大小:818176
    • 提供者:u013428116
  1. 短文本相似度计算在用户交互式问答系统中的应用

  2. 文本分析
  3. 所属分类:其它

    • 发布日期:2016-03-17
    • 文件大小:1048576
    • 提供者:java_pythoner
  1. 中文短文本分析资料打包

  2. 中文短文本分析资料打包,包括中文分词,深度学习,文本发掘等方向的入门论文等
  3. 所属分类:专业指导

    • 发布日期:2017-03-26
    • 文件大小:63963136
    • 提供者:wangyaninglm
  1. 短文本的情感分析

  2. 短文本情感分析,应用机器学习的方法与理论,优化过去文献的问题
  3. 所属分类:机器学习

    • 发布日期:2018-03-28
    • 文件大小:278528
    • 提供者:carbon107
  1. 中文短文本情感分析语料 外卖评价

  2. 短文本情感分析语料,某外卖平台收集的用户评价,正负各8000条,共16000条
  3. 所属分类:机器学习

    • 发布日期:2018-02-02
    • 文件大小:395264
    • 提供者:cstkl
  1. NLPCC2014任务1和任务2微博情感分析语料

  2. 任务1有14000条标注训练数据非常适合做微博短文本的情感分析。
  3. 所属分类:机器学习

    • 发布日期:2018-11-06
    • 文件大小:13631488
    • 提供者:m201672389
  1. 基于卷积记忆神经网络的微博短文本分析

  2. PDF格式。微博短文本情感分析的目的是发现用户对热点事件的观点及态度。已有的方法大多是基于词袋模型,然而,词袋模型 无法准确捕获带有情感倾向性的语言表现特征。结合卷积神经网络( CNN) 和长短期记忆网络( LSTM) 模型的特点,提出了卷 积记忆神经网络模型( CMNN) ,并基于此模型来解决情感分析问题。与传统算法相比,模型避免了具体任务的特征工程设计; 与 CNN 和LSTM 相比,模型既能够有效提取短文本局部最优特征,又能够解决远距离的上下文依赖。通过在COAE2014 数据集 上的实
  3. 所属分类:机器学习

    • 发布日期:2018-11-22
    • 文件大小:325632
    • 提供者:weixin_39086917
  1. 网络大数据的文本内容分析

  2. 文本内容分析是实现大数据的理解与价值发现的有效手段。尝试从短文本主题建模、单词表达学习和网页排序学习3个子方向,探讨网络大数据文本内容分析的挑战和研究成果,最后指出未来大数据文本内容分析的一些研究方向和问题。
  3. 所属分类:机器学习

    • 发布日期:2019-06-24
    • 文件大小:575488
    • 提供者:janpychou111111
  1. 自然语言处理(NLP):08 PyTorch深度学习之TextCNN短文本分类

  2. 本章节主要研究内容:基于PyTorch 深度学习工具来完成短文本分类 知识点 业务需求 文本分类应用场景、技术方案以及挑战 技术架构 文本分析 词向量 CNN 原理 tensorboardX 可视化 项目实战: 基于TextCNN短文本分类,主要从数据预处理、构建此表、Embedding、模型训练、tensorboardX可视化以及在线服务几个重要的环境进行学习 文本分类应用场景 文章分类服务对文章内容进行深度分析,输出文章的主题一级分类、主题二级分类及对应的置信度,该技术在个性化推荐、文章聚合
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:605184
    • 提供者:weixin_38663167
  1. 基于主题-关键词图的链接分析的短文本特征丰富

  2. 基于主题-关键词图的链接分析的短文本特征丰富
  3. 所属分类:其它

    • 发布日期:2021-03-19
    • 文件大小:1048576
    • 提供者:weixin_38629206
  1. 微博短文本预处理及学习研究综述

  2. 认为因短文本具有特征稀疏性和高度冗余性,微博短文本的预处理及学习方法研究已经成为微博信息挖掘及应用的关键,并在许多方面有着非常重要和广泛的应用。重点分析微博短文本的特性,并对微博短文本的预处理和学习方法及其应用现状进行归纳和总结,包括短文本特征表示、短文本特征拓展与选择、短文本分类与聚类学习、热点事件发现及自动文摘等。最后指出相关研究的局限性,并对未来的发展方向进行展望。
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:755712
    • 提供者:weixin_38690830
  1. 基于多重增强图和主题分析的社交短文本检索方法

  2. 基于多重增强图和主题分析的社交短文本检索方法
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:577536
    • 提供者:weixin_38719564
  1. TextCluster:短文本聚类预处理模块-源码

  2. 短文本聚类 项目介绍 短文本聚类是常用的文本预处理步骤,可以用于洞察文本常见模式,分析设计语义解析规范,加速相似句子查询等。本项目实现了内存友好的短文本聚类方法,并提供了相似句子查询接口。 依赖库 点安装tqdm解霸 使用方法 聚类 python cluster.py --infile ./data/infile \ --output ./data/output 具体参数设置可以参考cluster.py文件内_get_parser()函数参数说明,包含设置分词词典,重置词,匹配采样数,匹配度阈值
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:1048576
    • 提供者:weixin_42131414
  1. news-emotion::chart_decreasing:金融文本情感分析模型-源码

  2. 0.快速开始 挑战杯项目:金融文本情感分析模型|| 挑战杯项目:财务文本情感分析模型 金融领域短文本情感分析 配置要求: python 3.x 1.使用方法 1.0下载 sudo git clone https://github.com/AsuraDong/news-emotion.git news_emotion mv -R ./news_emotion/ 你的程序路径/ 1.1文件结构 clean_data / # 清洗数据 __init__ . py clean_html
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:3145728
    • 提供者:weixin_42102634
  1. 网络大数据的文本内容分析

  2. 文本内容分析是实现大数据的理解与价值发现的有效手段。尝试从短文本主题建模、单词表达学习和网页排序学习3个子方向,探讨网络大数据文本内容分析的挑战和研究成果,最后指出未来大数据文本内容分析的一些研究方向和问题。
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:1048576
    • 提供者:weixin_38727087
  1. 基于子语义空间的挖掘短文本策略方法

  2. 为解决精准识别短文本数据的问题,提出一种基于子语义空间的短文本策略挖掘方法。该方法首先采用语义空间技术,解决短文本在分析过程中存在的“词汇鸿沟”与“数据稀疏”问题;然后基于聚类算法将语义空间划分为多个子语义空间,在各子语义空间并行挖掘关联规则,提高了策略生成的效率与质量;最后利用二叉树进行策略归并,生成最简策略集。实验证明,与传统的分类模型相比,该方案生成的策略集在误报率为6.5%的情况下,准确率可达88%。在违规短信的发现处理中,使用该技术挖掘的策略集,覆盖能力强、准确率高,具有很强的实用性。
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:765952
    • 提供者:weixin_38560797
  1. 基于层次分析的微博短文本特征计算方法

  2. 为了建立用户精准兴趣模型以有效发现具有相似兴趣的用户群,提出了一种针对微博的短文本特征计算方法用于聚类算法,提升聚类效果以更好地挖掘微博用户的相似兴趣集合。该方法融合了微博转发数、评论数、点赞数等多个关键指标来度量微博短文本特征的重要性。同时,引入层次分析技术,改进了传统的tf-idf特征计算方法,并利用经典文本聚类算法进行实验。实验结果表明,改进后的短文本特征计算方法与传统的tf-idf特征计算方法相比,在类内集中度和类间分散度上取得了更好的效果。
  3. 所属分类:其它

    • 发布日期:2021-01-14
    • 文件大小:628736
    • 提供者:weixin_38565801
« 12 3 »