您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 百度百科编号前2700000的词条名

  2. 本文件为实际抽取的百度百科编号前2700000的词条名。 由于百度百科会有审核不通过或删除的词条,因而不代表就总共有2700000个词条,详细请自行查阅百度百科的编号方式。 存储方式为文本文件,编号到词条名的映射,三元组格式存储,nt文件。 压缩包约15M,解压后约55M。
  3. 所属分类:专业指导

    • 发布日期:2010-04-28
    • 文件大小:14680064
    • 提供者:oxstar
  1. AMIE:在不完整知识库下的关联规则挖掘(代码+文档)

  2. 最近几年,例如YAGO和DBpedia等大规模知识库发展有了很大的进步。知识库提供了大量的不同种类的实体信息,如人、国家、河流、城市大学等等,同时知识库包含了大量的在实体(entity)间的关系既事实(fact)。当今的知识库包含的数据量是巨大的通常有百万个实体和上亿个描述实体间关系的事实数据。 虽然目前的知识库存在大量的实体和事实数据,但是这样大规模的数据仍然不完整。目前构建知识库的方法主要有两种,一种是从大量的文本中抽取事实但这种方法必然会带来大量的噪声数据,第二是人工扩展,但这样的方法对
  3. 所属分类:数据库

    • 发布日期:2015-03-18
    • 文件大小:2097152
    • 提供者:obaishusheng
  1. 特定领域概念属性关系抽取方法研究

  2. 针对互联网中开放式中文文本关系难以抽取的问题, 提出一个新的关系抽取方法。 为缓解关系三元组抽取较难的问题, 给出一个新的基于属性和概念实例的关系三元组构造方法, 抽取的大量概念实例关系三元组中 不仅包含大量显式关系三元组 , 还包含部分隐式关系三元组。 在此基础上, 针对关系三元组含有噪声和错误的
  3. 所属分类:机器学习

    • 发布日期:2018-07-03
    • 文件大小:1041408
    • 提供者:qq_36182996
  1. 无指导的开放式中文实体关系抽取

  2. 无指导的开放式中文实体关系抽取,对构建知识图谱中的三元组抽取有一定的参考作用
  3. 所属分类:机器学习

    • 发布日期:2018-07-06
    • 文件大小:549888
    • 提供者:qq_36182996
  1. Python-2019年百度的三元组抽取比赛一个baseline

  2. 2019年百度的三元组抽取比赛,一个baseline
  3. 所属分类:其它

    • 发布日期:2019-08-10
    • 文件大小:5120
    • 提供者:weixin_39840924
  1. Python-爬取百度百科中文页面抽取三元组信息构建中文知识图谱

  2. 爬取百度百科中文页面,抽取三元组信息,构建中文知识图谱
  3. 所属分类:其它

    • 发布日期:2019-08-10
    • 文件大小:18874368
    • 提供者:weixin_39840387
  1. 基于强化学习的自举式关系抽取算法

  2. 基于强化学习的自举式关系抽取算法,王韬,程祥,知识图谱由形式的三元组构成,能够将海量数据中的知识以图的方式进行组织,从而为下游智能服务的实现提供�
  3. 所属分类:其它

    • 发布日期:2020-03-09
    • 文件大小:346112
    • 提供者:weixin_38657353
  1. 基于依存分析的开放式中文实体关系抽取方法.pdf

  2. 该方法利用依存句法分析简称依存分析实现开放式中文实体关系抽取,首先对一个句子进行依存分析,再结合中文语法启发式规则和依存分析的结果抽取关系表述,并根据距离确定论元位置,最后进行三元组输出。
  3. 所属分类:机器学习

    • 发布日期:2020-02-11
    • 文件大小:1022976
    • 提供者:sinat_16211087
  1. 知识图谱概念与技术.PPT 老师自己上课用的

  2. 知识图谱是一项综合性的复杂技术,其主要关注于知识的表示、知识图谱的构建以及应用这三个方面的研究内容。其中知识的表示即是指三元组,知识图谱的构建则主要涉及信息抽取的相关技术。
  3. 所属分类:专业指导

    • 发布日期:2019-10-08
    • 文件大小:58720256
    • 提供者:jenray
  1. Python-利用pandas将excel中数据抽取以三元组形式加载到neo4j数据库中构建相关知识图谱

  2. 利用pandas将excel中数据抽取,以三元组形式加载到neo4j数据库中构建相关知识图谱
  3. 所属分类:其它

    • 发布日期:2019-08-10
    • 文件大小:30720
    • 提供者:weixin_39840387
  1. Python-2019年百度的三元组抽取比赛科学空间队源码

  2. 2019年百度的三元组抽取比赛,“科学空间队”源码
  3. 所属分类:其它

    • 发布日期:2019-08-10
    • 文件大小:17408
    • 提供者:weixin_39840515
  1. \"Tag-TextRank:一种基于Tag的网页关键词抽取方法\"分享总结

  2. NULL 博文链接:https://snv.iteye.com/blog/1886969在 Wikipedia中的实体,并且算法的复杂度很高。另外,国内一些学者lm2也开展了关键 词提取的研究。实际上,从上面的工作,我们可以得到这样的基本结论:基本的R特征可 以找到部分关键词,而加入用户信息或者领域知识可以进一步提高关键词抽取效果。 本文利用Tag信息来提高关键词的抽取效果。近年来,Tag数据作为·种新的资源, 其挖掘和利用已经成为信息检索、社区发现等领域的研究热点。从数据质量上讲,Iag数 据
  3. 所属分类:其它

    • 发布日期:2019-04-20
    • 文件大小:1046528
    • 提供者:weixin_38669628
  1. 中文知识图谱的构建,

  2. 爬取百度百科中文页面,抽取三元组信息,构建中文知识图谱
  3. 所属分类:深度学习

    • 发布日期:2021-01-02
    • 文件大小:18874368
    • 提供者:bruce__ray
  1. 爬取百度百科中文页面,抽取三元组信息,构建中文知识图谱

  2. 爬取百度百科中文页面,抽取三元组信息,构建中文知识图谱
  3. 所属分类:深度学习

    • 发布日期:2021-01-02
    • 文件大小:1048576
    • 提供者:bruce__ray
  1. 利用pandas将excel中数据抽取

  2. 利用pandas将excel中数据抽取,以三元组形式加载到neo4j数据库中构建相关知识图谱
  3. 所属分类:深度学习

    • 发布日期:2021-02-28
    • 文件大小:8192
    • 提供者:bruce__ray
  1. 构建和剖析中英三元组可比语料库

  2. 由于受到翻译腔的影响,中英平行语料库存在固有的扭斜的语言模型。显然,用这样的语料库训练的机器翻译、跨语言检索等自然语言处理系统也承袭了扭斜的语言模型,严重影响到应用系统的性能。为了克服平行语料库固有的缺陷,本文提出了构建和剖析中英三元组可比语料库的技术研究。这项研究采用可比语料库和语言自动剖析技术,使用统计和规则相结合的方法,对由本族英语、中式英语和标准中文三元素所组成的三元组可比语料库中的本族英语和中式英语进行统计分析。在此基础上,利用n-元词串、关键词簇等自动抽取技术挖掘基于本族语言模型的双
  3. 所属分类:其它

    • 发布日期:2021-02-09
    • 文件大小:425984
    • 提供者:weixin_38601878
  1. 三元组可比语料库自动剖析技术研究与应用

  2. 国内外基于语料库的翻译研究主要集中在翻译共性、翻译规范、译者风格和翻译培训等涉及翻译理论和翻译实践方面的研究;提出的基于三元组可比语料库的自动语言剖析技术扩大了该研究领域的内涵,使其包括面向自然语言处理的应用研究。从工程可实现性考虑,创新性地提出了建造三元组可比语料库,利用n-元词串、关键词簇和语义多词表达等自动抽取技术,通过对比中式英语表达,发掘英语本族语言模型,实现改进和发展机器翻译、跨语言信息检索等自然语言处理应用的目标。
  3. 所属分类:其它

    • 发布日期:2021-02-09
    • 文件大小:1048576
    • 提供者:weixin_38674627
  1. WEB_KG:爬取百度百科中文页面,抽取三元组信息,建立中文知识图谱-源码

  2. 开源web知识图谱项目 爬取百度百科中文页面 解析三元组和网页内容 建立中文知识图谱 建立百科bot(重建中) 更新20200720 Windows上的部署参考,感谢LMY-nlp0701! 更新20191121 迁移代码到爬虫框架scrapy 优化了抽取部分代码 数据持久化迁移到mongodb 修复chatbot失败问题 开放neo4j后台界面,可以查看知识图谱成型效果 提示 如果是项目问题,请提问题。 如果涉及到不方便公开的,请发邮件。 ChatBot请访问 成型的百科知识图谱访问,用户
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:1048576
    • 提供者:weixin_42129412
  1. 机器翻译机制

  2. 机器翻译 机器翻译, 将一段文本从一种语言自动翻译为另一种语言。其 输出为单词序列。 处理步骤 数据预处理 分词 建立词典 输入模型 Encodr-Decoder Sequence to Sequence 注意力机制 看作适合处理由一个句子(或篇章)生成另外一个句子(或篇章)的通用处理模型。对于句子对。 ——–(思考:对很通用,X是一个问句,Y是答案;X是一个句子,Y是抽取的关系三元组;X是汉语句子,Y是汉语句子的英文翻译。等等),我们的目标是给定输入句子X,期待通过Encoder-Dec
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:376832
    • 提供者:weixin_38536841
  1. 融合对抗主动学习的网络安全知识三元组抽取

  2. 针对当前网络安全领域知识获取中所依赖的流水线模式存在实体识别错误的传播,未考虑实体识别与关系抽取任务间的联系,以及模型训练缺乏标签语料的问题,提出一种融合对抗主动学习的端到端网络安全知识三元组抽取方法。首先,将实体识别与关系抽取通过联合标注策略建模为序列标注任务;然后,设计融合动态注意力机制的BiLSTM-LSTM模型实现实体与关系的联合抽取,并形成三元组;最后,基于对抗网络训练一个判别器模型,增量地筛选出高质量的待标注数据进行标注,并通过迭代训练不断提升联合抽取模型的性能。通过实验表明,所提方
  3. 所属分类:其它

    • 发布日期:2021-01-13
    • 文件大小:822272
    • 提供者:weixin_38551059
« 12 »