您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 专门用途术语提取工具

  2. 用于提取科技语料中的术语,适用于Mac系统
  3. 所属分类:专业指导

    • 发布日期:2010-10-09
    • 文件大小:9216
    • 提供者:Mikescot
  1. 术语提取工具

  2. 中文术语提取工具。基于统计分词技术。对于大篇幅的文章提取术语效果良好。免费运行环境:.net framework 2.0 为了以后支持多种格式,用c#编写,所以如果没有这个环境,可能比较麻烦,需要更新。。。。
  3. 所属分类:C#

    • 发布日期:2008-06-25
    • 文件大小:66560
    • 提供者:guajunjie
  1. TFIDF关键词提取

  2. 利用java实现TFIDF,提取关键词,是术语提取、推荐系统等应用的基础之一。
  3. 所属分类:Java

    • 发布日期:2014-09-07
    • 文件大小:14336
    • 提供者:tudou1982
  1. 来自仿生原子的介子核子术语

  2. 较早的工作表明,中等πN阈值等矢量幅值b1(ρ)在pionic原子中从ρ= 0自由空间值重新归一化约30%,这与归一化导致in-π阈值的低密度降低有关。 中等夸克冷凝物和介子核子σ项ππN的介子衰减常数fπ。 接受这种方法的有效性,我们从周期表中大规模的仿生原子能级位移和宽度数据中提取了σπN。 我们的拟合值σπN= 57±7 MeV对于σN关联的等矢量s波项以外的πN相互作用项的变化具有鲁棒性。 对密度上的先导阶的更高阶校正涉及一些抵消,从而因此仅暗示百分之几的整体系统不确定性。 此处得出的σ
  3. 所属分类:其它

    • 发布日期:2020-04-03
    • 文件大小:365568
    • 提供者:weixin_38603219
  1. 使用结构语法,术语扩展和提炼的提取摘要

  2. 本文研究了开发的程序,并报告了进行的实验,以研究使用WordNet [1]和本地词库[2]来应用文本句子和术语扩展的组合结构属性在选择最合适的提取性文本摘要中的效用用于特定文档。 标记句子并对其进行归一化,然后使用最长公共子序列(LCS)算法[3] [4]选择最相似的句子子集。 计算的相似度基于组成文档的句子对的LCS。 计算归一化分数并将其用于对句子进行排名。 然后将选定的最相似句子的顶部子集标记化,以生成一组重要的关键字或术语。 使用1)WorldNet将产生的术语进一步扩展为两个子集。 2
  3. 所属分类:其它

    • 发布日期:2020-06-03
    • 文件大小:461824
    • 提供者:weixin_38599231
  1. tm2tb:多语言术语提取Web应用程序-源码

  2. tm2tb 自动术语提取Python Web应用程序 TM2TB是一个python应用程序,可从双语文档中自动提取高精度的术语候选对。
  3. 所属分类:其它

    • 发布日期:2021-03-20
    • 文件大小:2097152
    • 提供者:weixin_42131367
  1. 基于逐层剪枝的中文高频重复模式快速提取算法

  2. 为了从大规模语料中快速提取高频重复模式,以递增n-gram模型为基础,使用散列数据结构提取重复串,并提出了一种基于低频字符和层次剪枝的逐层剪枝算法,用于过滤低频垃圾字串,减少I/O读写次数。在此基础上,应用改进的字串排序算法,使字符串排序可在O(n)时间内完成,从而有效提高重复模式的提取效率。实验表明,该算法是一种有效的重复模式提取算法,其I/O读写次数同语料规模呈线性关系,远小于使用首字符进行语料划分的方法,能快速有效地从规模远大于内存容量的文本语料中提取重复模式,特别适合于大规模语料的高频重
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:901120
    • 提供者:weixin_38518376
  1. 从生物医学文献中提取文献水平的化学诱发疾病关系的有效神经模型

  2. 由于识别化学物和疾病之间的关系(CDR)对于生物医学研究和医疗保健很重要,因此BioCreative V提出的挑战要求自动挖掘化学物和疾病之间的因果关系,这种关系可能跨越句子边界。 尽管大多数系统都在探索特征工程和知识库来识别文档级CDR关系,但是自动学习仅在句子中受到限制...在这项工作中,我们提出了一种有效的模型,该模型可以自动学习文档级语义表示以提取化学诱导的疾病通过结合卷积神经网络和递归神经网络的优势来实现文章之间的(CID)关系。 首先,为了有目的地收集上下文,对存在于文章多个句子中的
  3. 所属分类:其它

    • 发布日期:2021-03-15
    • 文件大小:831488
    • 提供者:weixin_38614484
  1. 基于汉维医疗平行语料的双语术语抽取研究

  2. :为提高汉语和维吾尔语医学领域机器翻译质量,解决人工提取和翻译大量医学术语耗 时费力的问题,提出基于词向量表示的双语术语抽取方法,并与传统统计短语对齐抽取进行对 比.首先,自建45216句汉语医疗语料,人工翻译获得23996句维语语料,人工采集汉语医学词 汇65394条,翻译获得31421条维语术语,对汉语语料分词,对维语语料形态切分,获得实验数 据;其次,使用词向量方法,设计了基于词向量表示的双语术语抽取实验,准确率为25.12%;并 将传统统计短语对齐抽取技术应用于汉维医疗平行语料,准确率为
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:558080
    • 提供者:weixin_38543293
  1. 中医针灸领域中术语自动提取的研究

  2. 中医针灸领域中术语自动提取的研究
  3. 所属分类:其它

    • 发布日期:2021-03-10
    • 文件大小:243712
    • 提供者:weixin_38646634
  1. 学习使用语义资源完善生物医学信息检索的扩展术语

  2. 学习排名利用机器学习方法通​​过监督构建排名模型来解决排名问题,该排名模型需要将文档的固定长度特征向量作为输入,并输出通过迭代减少预定义排名损失而学习到的排名模型。 始终根据经典的文本统计信息来提取文档特征,并且不同的特征对排名性能的贡献也不同。 鉴于定义良好的特征将对检索性能做出更大的贡献,因此我们研究了使用自动编码器来丰富文档的特征表示。 自动编码器作为深度神经网络的基本构建模块,已成功用于许多文本挖掘任务中以生成有效特征。 为了丰富学习排名的功能空间,我们在自动编码器的损失函数中引入了监督
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:2097152
    • 提供者:weixin_38651450
  1. 联合约束的LDA模型用于产品和观点的联合提取

  2. 潜在狄利克雷分配(LDA)模型是文档级的概率模型,已被广泛使用。 但是,该模型的一个基本问题是在识别句子中的共现关系(例如,方面-方面,方面-方面等)方面存在不足。 为了解决该问题,我们提出了一种关联约束的LDA(AC-LDA),以有效地捕获共现关系。 具体来说,根据产品评论中句法结构的基本特征,我们将三种主要类型的单词联想组合形式化,并精心设计相应的标识。 为了减少全局方面词对局部分布的影响,我们对全局方面应用了重要的约束。 最后,将约束条件和相关的关联组合合并到LDA中,以指导学习过程中主题
  3. 所属分类:其它

    • 发布日期:2021-03-07
    • 文件大小:894976
    • 提供者:weixin_38594252
  1. translator:从任何代码到JSON文件的转换提取-源码

  2. 转换器-从任何代码到JSON文件的转换提取 Translator提取项目的所有可翻译术语,并将所有内容放入一个JSON文件,该文件可以从几乎任何编程语言(包括Javascr ipt)中读取。 它最初设计为与多语言SPA项目结合使用,但可扩展到您正在开发的任何类型的项目,无论源代码语言是什么(如果可以读取JSON),都可以使用。 特征 用Go语言编写,并作为软件包模块提供 从__()和translate()函数中提取术语 支持__p()和__p() pluralize()函数的pluralize
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:1048576
    • 提供者:weixin_42138703
  1. little_shot:术语提取的少量学习方法-源码

  2. 术语提取的少量学习方法 在新环境中安装: git clone https://github.com/danielkorat/few_shot.git cd few_shot chmod +x install.sh ./install.sh
  3. 所属分类:其它

    • 发布日期:2021-03-04
    • 文件大小:875520
    • 提供者:weixin_42165490
  1. 一种自动术语提取的新型主题模型

  2. 一种自动术语提取的新型主题模型
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:613376
    • 提供者:weixin_38644780
  1. 特征工程vs.特征提取

  2. 本文来自于csdn,本文详细介绍了特征工程和特征提取如何发挥作用,希望对您的学习有帮助。“特征工程”这个华丽的术语,它以尽可能容易地使模型达到良好性能的方式,来确保你的预测因子被编码到模型中。例如,如果你有一个日期字段作为一个预测因子,并且它在周末与平日的响应上有着很大的不同,那么以这种方式编码日期,它更容易取得好的效果。但是,这取决于许多方面。首先,它是依赖模型的。例如,如果类边界是一个对角线,那么树可能会在分类数据集上遇到麻烦,因为分类边界使用的是数据的正交分解(斜树除外)。其次,预测编码过
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:158720
    • 提供者:weixin_38711369
  1. 如何用TF-IDF算法提取文本中的关键词?

  2. IDF,是“InverseDocumentFrequency”(逆文档频率)的缩写。我觉得这个算法可用于帮助译者提取一篇待译文章中的“术语”,所以准备写一篇文章来简要介绍这个算法的实现方法。我将使用百度的分词技术来处理中文文本,用以计算中文词语的“TF-IDF”值。在本公众号之前的文章中,我们已经介绍了如何引入百度的分词API,本文就不再介绍细节了。首先启动本地开发环境XAMPP,将百度分词API下载到工作文件夹(下图的api文件夹中):在“index.php”中输入百度分词API引入模板,并在
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:559104
    • 提供者:weixin_38614268
  1. termitup:TermitUp是一种从语料库生成丰富的链接术语的工具,可从语言链接开放数据云中提取知识-源码

  2. TermitUp TermitUp是用于丰富术语的工具:给定特定领域的语料库,TermitUp可以执行统计术语提取,并使用一系列语言过程和外部工具(例如Añotador( ),以清除时间表达式。 然后,它会查询几种语言资源(语言链接开放数据云的某些部分)以寻找与术语列表中的候选词匹配的候选词。 TermitUp为源词和候选词建立感知指示符,并执行Word Sense消除歧义过程(使用Semantic Web Company的服务),将那些概念与最接近的域匹配。 根据外部资源中匹配的概念,T
  3. 所属分类:其它

    • 发布日期:2021-02-09
    • 文件大小:59768832
    • 提供者:weixin_42106357
  1. pyate:PYthon自动术语提取-源码

  2. PYthon自动术语提取 使用spaCy POS标记的术语提取算法的Python实现,例如C值,基本,组合基本,怪异和术语提取器。 如果您对其他ATE算法有建议,则希望在此软件包中实施该算法,并将其作为该算法所基于的论文的一个问题。 对于用Scala和Java实现的ATE软件包,请分别参见和 。 :party_popper: 安装 使用点子: pip install pyate https://github.com/explosion/spacy-models/releases/dow
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:4194304
    • 提供者:weixin_42157556
  1. 专利分析中使用摘要和优先权并发的术语提取

  2. 专利分析中使用摘要和优先权并发的术语提取
  3. 所属分类:其它

    • 发布日期:2021-03-28
    • 文件大小:118784
    • 提供者:weixin_38537315
« 12 3 4 5 6 7 8 »