您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 人民日报(北大)语料库

  2. 分词训练语料库,仅供学习和研究使用,禁止用于商业行为
  3. 所属分类:专业指导

    • 发布日期:2009-10-31
    • 文件大小:8388608
    • 提供者:xufengye256
  1. 计算机语言学概论讲义

  2. 计算机语言学概论 北大讲义 第一章计算语言学概述(2学时) 第二章语言知识的形式化简介(2学时) 第三章当代形式句法理论(4学时) 第四章语义知识的形式表示(4学时) 第五章语篇知识的形式表示(2学时) 第六章语料库(2学时) 第七章词法分析算法(4学时) 第八章句法分析算法(6学时) 第九章机器翻译(4学时) 第十章文本分类(2学时) 第十一章信息检索(2学时) 第十二章信息提取(2学时)
  3. 所属分类:其它

    • 发布日期:2009-12-30
    • 文件大小:5242880
    • 提供者:spendingtime
  1. 用来中文分词评测用的北大语料库

  2. 北大98年1月份语料库 迈向/v 充满/v 希望/n 的/u 新/a 世纪/n
  3. 所属分类:专业指导

    • 发布日期:2010-12-01
    • 文件大小:8388608
    • 提供者:acmok
  1. 北大汉语语法信息词典

  2. 用于自然语言处理,作为语料库使用,可用于分词,词性标注
  3. 所属分类:教育

    • 发布日期:2012-11-02
    • 文件大小:446464
    • 提供者:linxuantoo
  1. 北大语料库(一月份)

  2. 自然语言处理 ,命名实体识别语料库,分词,测试使用,仅用于研究学习,严禁商业使用
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:8388608
    • 提供者:hj398984059
  1. ICTPOS3.0汉语词性标记集

  2. 计算所汉语词性标记集(共计99个,22个一类,66个二类,11个三类)主要用于中国科学院计算技术研究所研制的汉语词法分析器、句法分析器和汉英机器翻译系统。本标记集主要参考了以下词性标记集: 1. 北大《人民日报》语料库词性标记集; 2. 北大2002新版词性标记集(草稿); 3. 清华大学汉语树库词性标记集; 4. 教育部语用所词性标记集(国家推荐标准草案2002版); 5. 美国宾州大学中文树库(ChinesePennTreeBank)词性标记集;
  3. 所属分类:互联网

    • 发布日期:2014-09-04
    • 文件大小:62464
    • 提供者:beiyouyu
  1. 抓取北大语料库词频

  2. 通过抓取北大语料库网页,获取词频数据,用的是asp代码,XMLHTTP
  3. 所属分类:机器学习

    • 发布日期:2018-11-14
    • 文件大小:5120
    • 提供者:lengguao
  1. 自然语言处理-条件随机场工具集

  2. 自然语言处理、条件随机场 运用字标注法进行中文分词,对语料进行字标注,观察分词效果。开源的条件随机场工具包“CRF++: Yet Another CRF toolkit”进行分词。 可以使用的中文语料资源是SIGHAN提供的backoff 2005语料,目前封闭测试最好的结果是4-tag+CFR标注分词,在北大语料库上可以在准确率,召回率以及F值上达到92%以上的效果,在微软语料库上可以到达96%以上的效果。
  3. 所属分类:机器学习

    • 发布日期:2020-03-22
    • 文件大小:1048576
    • 提供者:qianjin_w
  1. 现代汉语语料库加工规范(pku)

  2. 北大计算语言学研究所从1992年开始进行汉语语料库的多级加工研究。第一步是对原始语料进行切分和词性标注。1994年制订了《现代汉语文本切分与词性标注规范V1.0》。几年来已完成了约60万字语料的切分与标注,并在短语自动识别、树库构建等方向上进行了探索。在积累了长期的实践经验之后,最近又进行了《人民日报》语料加工的实验。为了保证大规模语料加工这一项重要的语言工程的顺利进行,北大计算语言学研究所于1998年10月制订了《现代汉语文本切分与词性标注规范V2.0》(征求意见稿)。因这次加工的任务超出词语
  3. 所属分类:专业指导

    • 发布日期:2010-10-20
    • 文件大小:302080
    • 提供者:yjsmzq
  1. 北大人民日报语料库98年1月

  2. 北大人民日报语料库98年1月,分词研究用
  3. 所属分类:专业指导

    • 发布日期:2010-08-16
    • 文件大小:512000
    • 提供者:banana0302
  1. Segmentor:使用北大​​-富士通语料库,LSTM网络的中文分词系统-源码

  2. 分割器 使用北大​​-富士通语料库,LSTM网络的中文分词系统 在书面语中分词效果不错。 “十三五”规划中规模:到2020年中国公民的科学素质要达到10%以上这个目标。之所以设定10%的目标,是因为一个国家想要进入创新型国家行列,公众具有较高的科学素质的比例至少达到10%。 “十三五”规划中的重点目标:到2020年中国公民的科学素质要达到10%以上这个目标。之所以设定10%的目标,是因为一个国家想要进入创新型国家行列,公众具有较早的科学素质的比例至少达到10%。
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:117440512
    • 提供者:weixin_42161497