您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 人民日报(北大)语料库

  2. 分词训练语料库,仅供学习和研究使用,禁止用于商业行为
  3. 所属分类:专业指导

    • 发布日期:2009-10-31
    • 文件大小:8388608
    • 提供者:xufengye256
  1. 用来中文分词评测用的北大语料库

  2. 北大98年1月份语料库 迈向/v 充满/v 希望/n 的/u 新/a 世纪/n
  3. 所属分类:专业指导

    • 发布日期:2010-12-01
    • 文件大小:8388608
    • 提供者:acmok
  1. 搜索引擎— 原理、技术与系统

  2. 很好的搜索引擎的入门书籍。  北大天网实验室出的一本书,主要结合了天网的实践,并有一套称为TSE的C++代码。      全书分为三部分。除了第三部分涉及更多的高级问题,理论性较强,书中描述也不太详细之外,前两部分对于非专业人士了解IR系统的“原理,技术与系统”很有帮助。该书对网页抓取,文本分析,索引建立,搜索效率等方面都做出了分析,提供了一个功能详尽的web文本信息检索框架,
  3. 所属分类:其它

    • 发布日期:2011-04-07
    • 文件大小:3145728
    • 提供者:wbgeorge
  1. ICTCLAS2009版中文分词系统

  2. 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级7次,目前已经升级到了ICTCLAS2009 用户词典接口扩展 用户可以动态增加、删除用户词典中的词,调节分词的效果。提高了用户词典使用的灵活性。 分词粒度可调 可以
  3. 所属分类:C++

    • 发布日期:2012-01-02
    • 文件大小:9437184
    • 提供者:yahawami
  1. 中科院分词器ICTCLAS

  2. 中科院语义分词 ICTCLAS 中科院官方于2009年2月19日发布了中科院中文分词器ICTCLAS2009版,转引官方介绍说明,新版本的中文分词系统在原有的基础上主要完善的有: 1、用户词典接口扩展 用户可以动态增加、删除用户词典中的词,调节分词的效果。提高了用户词典使用的灵活性。 2、分词粒度可调 可以控制分词结果的粒度。共享版本提供两种分词粒度,标准粒度和粗粒度,满足不同用户的需求。 3、词性标注功能加强 多种标注级的选择,系统可供选择的标注级有:计算所一级标注级,计算所二级标注集,北大
  3. 所属分类:Web开发

    • 发布日期:2012-03-08
    • 文件大小:2097152
    • 提供者:abing79
  1. 北大NLP课件-中文分词

  2. 北大詹卫东课件,详解中文分词的算法及发展状况。
  3. 所属分类:专业指导

    • 发布日期:2012-04-11
    • 文件大小:419840
    • 提供者:leonardo861216
  1. 北大汉语语法信息词典

  2. 用于自然语言处理,作为语料库使用,可用于分词,词性标注
  3. 所属分类:教育

    • 发布日期:2012-11-02
    • 文件大小:446464
    • 提供者:linxuantoo
  1. ICTCLAS f分词工具

  2. 中科院 北大 实现的 一级二级分词算法简单方便 只是感觉词源不够丰富 但是幸运的是可以自己添加新词啊
  3. 所属分类:其它

    • 发布日期:2012-11-15
    • 文件大小:8388608
    • 提供者:joy516688
  1. 北大自然语言理解讲义+NLTK教程

  2. 非常全的讲义 比较深入 特别是对各个算法的讲解非常清晰 chapter1 绪论 chapter2 自动分词 chapter3 词性标注:HMM+Viterbi 基于转换的错误驱动词性标注 chapter4 形式文法:自底向上 自顶向下 Earley Tomita GLR算法 特征结构与合一 增加合一约束的Ealey算法 chapter5 语义分析 chapter6 语篇分析与指代消解 chapter7-13 NLTK教程
  3. 所属分类:专业指导

    • 发布日期:2012-12-28
    • 文件大小:10485760
    • 提供者:lx198881
  1. 北大语料库(一月份)

  2. 自然语言处理 ,命名实体识别语料库,分词,测试使用,仅用于研究学习,严禁商业使用
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:8388608
    • 提供者:hj398984059
  1. 文本分类强力资料包!北大分词源码,中科院分词源码,潜在语义源码,wornet,机器学习库

  2. 北大分词系统 中科院分词系统 text_category.rar Intr2WordNet_zwd20030630.pdf WordNet.rar 潜在语义分析 pcp-2.2.zip
  3. 所属分类:专业指导

    • 发布日期:2008-11-07
    • 文件大小:8388608
    • 提供者:wtzmax
  1. 中文分词-北大常宝宝

  2. 北大计算语言学 常宝宝老师的课件,关于中文分词的。
  3. 所属分类:讲义

    • 发布日期:2015-10-30
    • 文件大小:1048576
    • 提供者:wusecaiyun
  1. ICTCLAS2009版中文分词系统

  2. 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级7次,目前已经升级到了ICTCLAS2009 用户词典接口扩展 用户可以动态增加、删除用户词典中的词,调节分词的效果。提高了用户词典使用的灵活性。 分词粒度可调 可以
  3. 所属分类:嵌入式

    • 发布日期:2009-02-23
    • 文件大小:9437184
    • 提供者:zhangshibin8500
  1. 中文分词词库

  2. 中科院的标注、北大标注集。也有词频。可以满足大多数的需求。这个是我写java分词器的时候用到的,现在分词器已经编写完毕,特把词库分享给大家。 分词总数是29万8左右。其中包括三级地名、名胜古迹、知名的山川河流、1万多成语,还有就是其中的一部词语是来自搜狗输入法的词库。
  3. 所属分类:Java

    • 发布日期:2018-08-24
    • 文件大小:9437184
    • 提供者:qq398581645
  1. 中文词库整理成sql,可以直接导入使用

  2. 中文分词词库,中科院和北大标注。包括地名,名胜古迹,知名山川河流,还有1万多的成语,包括一部分搜狗互联网词库。已经整理成sql语句,直接导入数据库即可使用。非常方便!
  3. 所属分类:Java

    • 发布日期:2018-08-24
    • 文件大小:12582912
    • 提供者:qq398581645
  1. 自然语言处理-汉语分词技术概述

  2. 北大教授的课程ppt,阐述汉语分词的基本知识和基本方法对比等。
  3. 所属分类:讲义

    • 发布日期:2018-11-06
    • 文件大小:629760
    • 提供者:tonylwj
  1. python调用中文分词.rar

  2. python调用分词,分词系统只可以用2.6版本,调用的是中文分词,可自己添加词典。演示时可选择计算机一级标注、二级标注、北大一级标注二级标注等选项,上边可输入中文,下边是分词后的效果,运行界面请参考截图区域图片演示。
  3. 所属分类:其它

    • 发布日期:2019-07-10
    • 文件大小:2097152
    • 提供者:weixin_39840650
  1. Python-pkusegpython一个北大高准确度的中文分词工具包

  2. python版本:高准确度中文分词工具,简单易用,跟现有开源工具相比大幅提高了分词的准确率。
  3. 所属分类:其它

    • 发布日期:2019-08-10
    • 文件大小:2097152
    • 提供者:weixin_39841882
  1. 北大人民日报语料库98年1月

  2. 北大人民日报语料库98年1月,分词研究用
  3. 所属分类:专业指导

    • 发布日期:2010-08-16
    • 文件大小:512000
    • 提供者:banana0302
  1. Segmentor:使用北大​​-富士通语料库,LSTM网络的中文分词系统-源码

  2. 分割器 使用北大​​-富士通语料库,LSTM网络的中文分词系统 在书面语中分词效果不错。 “十三五”规划中规模:到2020年中国公民的科学素质要达到10%以上这个目标。之所以设定10%的目标,是因为一个国家想要进入创新型国家行列,公众具有较高的科学素质的比例至少达到10%。 “十三五”规划中的重点目标:到2020年中国公民的科学素质要达到10%以上这个目标。之所以设定10%的目标,是因为一个国家想要进入创新型国家行列,公众具有较早的科学素质的比例至少达到10%。
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:117440512
    • 提供者:weixin_42161497
« 12 »