您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 计算所汉语词法分析系统ICTCLAS

  2. 词是最小的能够独立活动的有意义的语言成分,但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词法分析是中文信息处理的基础与关键。为此,中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了基于多层隐马模型的汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58%(最近的973专家组评测结
  3. 所属分类:嵌入式

    • 发布日期:2007-11-25
    • 文件大小:2097152
    • 提供者:yanghuan6215
  1. LJParser文本搜索与挖掘开发平台

  2. 一、简介 LJParser文本搜索与挖掘开发平台包括:全文精准搜索,新词发现,汉语分词标注,词语统计与术语翻译,自动聚类与热点发现,分类过滤,自动摘要,关键词提取,文档去重,正文提取等十余项功能。针对互联网内容处理的需要,融合了自然语言理解、网络搜索和文本挖掘的技术,提供了用于技术二次开发的基础工具集。开发平台由多个中间件组成,各个中间件API可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系统平台,可以供
  3. 所属分类:Web开发

    • 发布日期:2010-05-11
    • 文件大小:17825792
    • 提供者:lingjoin
  1. 自然语言处理论文集(别下载了,文件毁坏的, 对CSDN无语)

  2. 包括:汉语自动分词中的上下文相关歧义字段(CSAS)研究,面向Internet的中文新词语检测,一种中文分词词典新机制——双字哈希机制,统计语言模型及汉语音字转换的一些新结果,基于EM算法的汉语自动分词方法 等
  3. 所属分类:其它

    • 发布日期:2008-04-20
    • 文件大小:2097152
    • 提供者:yeetoo
  1. 北大汉语语法信息词典

  2. 用于自然语言处理,作为语料库使用,可用于分词,词性标注
  3. 所属分类:教育

    • 发布日期:2012-11-02
    • 文件大小:446464
    • 提供者:linxuantoo
  1. ICTCLAS2013

  2. 简介: 应各位ICTCLAS用户的要求,张华平博士提前发布ICTCLAS2013 版本,为了与以前工作进行大的区隔,并推广NLPIR自然语言处理与信息检索共享平台,从本版本开始,系统名称调整为NLPIR汉语分词系统。张博士先后倾力打造十余年,内核升级10次,全球用户突破20万,先后获得了2010年钱伟长中文信息处理科学技术奖一等奖,2003年国际SIGHAN分词大赛综合第一名,2002年国内973评测综合第一名。 NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性
  3. 所属分类:企业管理

    • 发布日期:2013-01-15
    • 文件大小:7340032
    • 提供者:nickpeng
  1. NLPIR(ICTCLAS2013)中文分词

  2. 张华平博士正式发布ICTCLAS2013 版本,为了与以前工作进行大的区隔,并推广NLPIR自然语言处理与信息检索共享平台,从本版本开始,系统名称调整为NLPIR汉语分词系统。张博士先后倾力打造十余年,内核升级10次,全球用户突破20万,先后获得了2010年钱伟长中文信息处理科学技术奖一等奖,2003年国际SIGHAN分词大赛综合第一名,2002年国内973评测综合第一名。 NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持G
  3. 所属分类:其它

    • 发布日期:2013-03-17
    • 文件大小:7340032
    • 提供者:lankelan
  1. 自然语言处理全集

  2. 自然语言处理(汉语)算法实现,Java语言实现,经过优化,效率很高。主要包括: 1)汉语分词,采用ICTCLAS系统和Lucene+庖丁解牛系统 2)情感倾向性分析,包括基于统计学习的SVM算法,基于情感词典的词语权重算法,给出文档的情感权重和情感倾向 3)文本聚类,包括KMeas算法实现,文档向量建模,以及采用Weka API 库效率比较 4)词语关系网络,包括词语距离计算,构建词语的近似程度,并刻画词语网络图 5)抽象摘要,采用TFIDF计算文档关键词进行摘要和关键字提取 经过部分优化,对
  3. 所属分类:Java

    • 发布日期:2014-11-29
    • 文件大小:6291456
    • 提供者:lixufeng1992
  1. 自然语言处理全集_代码结构说明.doc

  2. 自然语言处理(汉语)算法实现,Java语言实现,经过优化,效率很高。主要包括: 1)汉语分词,采用ICTCLAS系统和Lucene+庖丁解牛系统 2)情感倾向性分析,包括基于统计学习的SVM算法,基于情感词典的词语权重算法,给出文档的情感权重和情感倾向 3)文本聚类,包括KMeas算法实现,文档向量建模,以及采用Weka API 库效率比较 4)词语关系网络,包括词语距离计算,构建词语的近似程度,并刻画词语网络图 5)抽象摘要,采用TFIDF计算文档关键词进行摘要和关键字提取 经过部分优化,对
  3. 所属分类:Java

    • 发布日期:2014-11-29
    • 文件大小:25600
    • 提供者:lixufeng1992
  1. HanLP:汉语语言处理-源码

  2. HanLP是一系列模型与算法组成的NLP工具包,由大快搜索主导并完全开源,目标是普及自然语言处理在生产环境中的应用.HanLP具备功能完善,性能高效,架构清晰,语料时新,可自定义的特点。 HanLP提供下列功能: 中文分词 HMM-两字组(速度与精度最佳平衡;一百兆内存) 最短路分词,N-最短路分词 由字构词(侧重精度,全世界最大语料库,可识别新词;适合NLP任务) 感知机分词,CRF分词 词典分词(侧重速度,每秒数千万字符;省内存) 极速词典分词 所有分词器都支持: 索引全切分模式 用户自定
  3. 所属分类:机器学习

    • 发布日期:2019-03-07
    • 文件大小:98566144
    • 提供者:iskugs
  1. 统计自然语言处理

  2. 统计自然语言处理是一本很好的书籍,是一本很基础的书籍目录 序二 第2版前宣 第1版前言 第1章绪论 11基本概念 1.1.1语言学与语音学 2自然语言处理 11.3关于“理解”的标准 1,2自然语言处理研究的内容和面临的困难 1,2,1自然语言处理研宄的内容 1,22自然语言处理涉及的几个层次 1.2.3自然语言处理面临的困难 13自然语言处理的基本方法及其发展 13,1自然语言处理的基本方汏 3,2自然语言处理的发展 14自然语言处理的研究现状 本书的内容安挂 第2章顸备知识 2,1概率论基本
  3. 所属分类:Python

    • 发布日期:2019-03-04
    • 文件大小:25165824
    • 提供者:weixin_34749051
  1. 汉语自然语言分词词典

  2. 分词 词典 同义词词典 汉语 有18万分词词典和5000个同义词词典
  3. 所属分类:其它

    • 发布日期:2011-10-18
    • 文件大小:1048576
    • 提供者:chen552
  1. 相似度:相似度:相似度计算工具包,java编写。用于词,短语,句子,词法分析,情感分析,语义分析等相关的相似度计算-源码

  2. 相似 适用词,语法,句子,词法分析,情感分析,语义分析等相关的相似度计算。 相似度是由一系列算法组成的Java版相似度计算工具包,目标是传播自然语言处理中相似度计算方法。相似度是工具实用,性能高效,架构清晰,语料时新,可自定义的特点。 相似性提供下列功能: 词相似度计算 词林编码法相似度 汉语语义法相似度 知网词相似度 字面编辑距离法 初步相似度计算 简单而言相似度 句子相似度计算 词性和词序结合法 编辑距离算法 Gregor编辑距离法 优化编辑距离法 文本相似度计算 余弦相似度 编辑距离算
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:23068672
    • 提供者:weixin_42139357