您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 人民日报(北大)语料库

  2. 分词训练语料库,仅供学习和研究使用,禁止用于商业行为
  3. 所属分类:专业指导

    • 发布日期:2009-10-31
    • 文件大小:8388608
    • 提供者:xufengye256
  1. 《高校科教》采集的数据对象是中国部分有影响力重点高校的计算机科学与技术、软件工程相关专业科研、教学和学术论坛,主要内容包括研究方向和研究项目,采集日期范围2007-09-01至2007-10-01

  2. 此帮助文件的数据来源于各重点高校的校方网站,其内容都是转载的,版本为2.0。采集的数据对象是中国部分有影响力重点高校的计算机科学与技术、软件工程相关专业科研、教学和学术论坛,主要内容包括研究方向和研究项目,采集日期范围2007-09-01至2007-10-01。 为便于在科教研中快速查找需求内容,特制定一组索引关键词,如学术类关键词可让用户快速找到有学术相关活动通知的机构,教学类关键词让用户快速找到课件资源,具体分类如下: 学术类 学术报告 前沿学术论坛 学术动态 学术活动 会议论文 讲座预告
  3. 所属分类:专业指导

    • 发布日期:2009-12-02
    • 文件大小:1009664
    • 提供者:wantao1988
  1. 汉语已分割语料库,人民日报1998年

  2. 汉语已分割语料库, 人民日报1998年全年 文档
  3. 所属分类:C++

    • 发布日期:2009-12-30
    • 文件大小:8388608
    • 提供者:WangSpringDay
  1. 用于分词和命名实体识别的人民日报语料库

  2. 标准的分词语料库,也可用作命名实体识别。
  3. 所属分类:C++

    • 发布日期:2010-04-15
    • 文件大小:2097152
    • 提供者:snowpku002
  1. 计算机自然语言理解98年1月人民日报某语料库

  2. 语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。经过科学选材和标注、具有适当规模的语料库能够反映和记录语言的实际使用情况。人们通过语料库观察和把握语言事实,分析和研究语言系统的规律。语料库已经成为语言学理论研究、应用研究和语言工程不可缺少的基础资源。
  3. 所属分类:专业指导

    • 发布日期:2010-04-17
    • 文件大小:2097152
    • 提供者:wssgcsc
  1. 基于条件随机场(CRFs)的中文词性标注方法

  2. 本文提出一种基于CRFs 模型的中文词性标注方法。该方法利用CRFs 模型能够添加任意特征的优点,在使用词的上下文信息的同时,针对兼类词和未登录词添加了新的统计特征。在《人民日报》1 月份语料库上进行的封闭测试和开放测试中,该方法的标注准确率分别为98. 56 %和96. 60 %。
  3. 所属分类:专业指导

    • 发布日期:2010-05-20
    • 文件大小:353280
    • 提供者:jiangtinghaha
  1. 用来中文分词评测用的北大语料库

  2. 北大98年1月份语料库 迈向/v 充满/v 希望/n 的/u 新/a 世纪/n
  3. 所属分类:专业指导

    • 发布日期:2010-12-01
    • 文件大小:8388608
    • 提供者:acmok
  1. 最大匹配法文本分词

  2. 基于最大匹配的正向分词和反向分词。通过与训练语料库中进行比对,来对指定文本文件进行分词。训练语料库是人民日报1998年1月的文章,训练语料库是已经分好词的
  3. 所属分类:C++

    • 发布日期:2011-12-25
    • 文件大小:7340032
    • 提供者:hzh416
  1. 汉语已分割语料库

  2. 汉语已分割语料库,人民日报1998年,用于文本分类
  3. 所属分类:专业指导

    • 发布日期:2015-04-28
    • 文件大小:8388608
    • 提供者:qiaojialincs
  1. 人民日报1998年1月中文标注语料库

  2. 人民日报标注语料库(版本1.0,下面简称PFR语料库)是在得到人民日报社新闻信息中心许可的条件下,以1998年人民日报语料为对象,由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。该语料库对600多万字节的中文文章进行了分词及词性标注,其被作为原始数据应用于大量的研究和论文中。
  3. 所属分类:专业指导

    • 发布日期:2016-11-11
    • 文件大小:10485760
    • 提供者:xudaliang_
  1. 人民日报语料库

  2. 这个语料库自带分词。
  3. 所属分类:机器学习

    • 发布日期:2017-07-29
    • 文件大小:2097152
    • 提供者:qq_20511439
  1. 哈工大信息检索研究中心同义词词林扩展版及说明

  2. ∀同义词词林扩展版 # 收录词语近 7万条, 全部按意义进 行编排, 是一部同义类词典。哈工大信息检索研究室参照多部电子词典资源, 并按照人民日报语料库中 词语的出现频度, 只保留频度不低于 3的 (小规模语料的统计结果 ) 部分词语, 剔除 14 706个罕用词 和非常用词后, 词表共包含 77 343条词语。
  3. 所属分类:机器学习

    • 发布日期:2017-09-21
    • 文件大小:1032192
    • 提供者:zhengudaoer
  1. 人民日报2014年语料库

  2. 人民日报2014年语料库,2014.1.1至2014年1.23日人民日报语料库。
  3. 所属分类:机器学习

    • 发布日期:2018-05-14
    • 文件大小:85983232
    • 提供者:sugar_girl
  1. 自然语言词性标注程序

  2. 汉语的分词与词性标注程序,基于C++开发,可成功运行,其中的input文件是输入文件,output为输出,有一个自己编写的头文件和一个运行文件,语料库是人民日报语料库
  3. 所属分类:C++

    • 发布日期:2018-02-04
    • 文件大小:950272
    • 提供者:sh2245237188
  1. 1998年1月-6月人民日报语料库

  2. 1998年1月-6月人民日报语料库,已做词性标记,适用于自然语言处理序列标注等任务,如命名实体识别等,里面包含6个月份
  3. 所属分类:机器学习

    • 发布日期:2018-12-08
    • 文件大小:11534336
    • 提供者:ydf_micro
  1. 1998年人民日报语料库全

  2. 1998年人民日报语料库全 可用于中文分词,词频统计,等自然语言处理领域
  3. 所属分类:其它

    • 发布日期:2013-05-03
    • 文件大小:2097152
    • 提供者:itmayue
  1. 现代汉语语料库加工规范(pku)

  2. 北大计算语言学研究所从1992年开始进行汉语语料库的多级加工研究。第一步是对原始语料进行切分和词性标注。1994年制订了《现代汉语文本切分与词性标注规范V1.0》。几年来已完成了约60万字语料的切分与标注,并在短语自动识别、树库构建等方向上进行了探索。在积累了长期的实践经验之后,最近又进行了《人民日报》语料加工的实验。为了保证大规模语料加工这一项重要的语言工程的顺利进行,北大计算语言学研究所于1998年10月制订了《现代汉语文本切分与词性标注规范V2.0》(征求意见稿)。因这次加工的任务超出词语
  3. 所属分类:专业指导

    • 发布日期:2010-10-20
    • 文件大小:302080
    • 提供者:yjsmzq
  1. 北大人民日报语料库98年1月

  2. 北大人民日报语料库98年1月,分词研究用
  3. 所属分类:专业指导

    • 发布日期:2010-08-16
    • 文件大小:512000
    • 提供者:banana0302
  1. 人民日报语料库(中文分词语料库)

  2. 人民日报1998年1月份的语料库,加入了词性标注,北京大学开发,中文分词统计的好资料 人民日报1998年1月份的语料库,加入了词性标注,北京大学开发,中文分词统计的好资料
  3. 所属分类:专业指导

    • 发布日期:2020-09-08
    • 文件大小:2097152
    • 提供者:starmoonh
  1. 199801已标记词性.txt

  2. 该资源是以1998年人民日报语料为对象,由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。
  3. 所属分类:互联网

    • 发布日期:2020-11-17
    • 文件大小:2097152
    • 提供者:weixin_41862755
« 12 »