您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 信息检索研究室论文集第一卷

  2. 信息检索相关论文 集合一 1. 车万翔 刘挺 秦兵 李生 面向依存分析的搭配抽取方法研究 1 全国第六届计算语言学联合学术会议, 2001, 7 Collocation Extraction Oriented to Dependency Parsing 2. 秦兵 郑实福 刘挺 张刚 李生 基于改进的贝叶斯模型的中文网页分类器 8 全国第六届计算语言学联合学术会议, 2001, 7 An Improved Bayes Classifier for Chinese Web Pages 3. 张刚
  3. 所属分类:Web开发

    • 发布日期:2009-08-04
    • 文件大小:1048576
    • 提供者:chenls
  1. LJCorpus中文语料库分析软件

  2. LJCorpus试用版本下载地址 下载地址:http://www.lingjoin.com/download/LJCorpus.rar 介绍: LJCorpus中文语料库分析软件是一套专门针对中文生语料库的加工、抽取、统计与翻译全自动的综合语料分析系统,应用了领先的汉语词法分析技术、新词发现技术、统计挖掘技术以及词语翻译对齐技术,目前,东北师范大学中文系已经成功应用该软件对新加坡的语言进行了分析,极大提高了研究的效率。 LJCorpus中文语料库分析软件的四大功能主要包括: 1. 新词发现:
  3. 所属分类:专业指导

    • 发布日期:2010-04-17
    • 文件大小:12582912
    • 提供者:lingjoin
  1. 计算机自然语言理解98年1月人民日报某语料库

  2. 语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。经过科学选材和标注、具有适当规模的语料库能够反映和记录语言的实际使用情况。人们通过语料库观察和把握语言事实,分析和研究语言系统的规律。语料库已经成为语言学理论研究、应用研究和语言工程不可缺少的基础资源。
  3. 所属分类:专业指导

    • 发布日期:2010-04-17
    • 文件大小:2097152
    • 提供者:wssgcsc
  1. LJCorpus语料分析软件

  2. 这个软件可以对设定的语料库分词,提词,频度分析。便于语料的处理
  3. 所属分类:专业指导

    • 发布日期:2010-11-29
    • 文件大小:12582912
    • 提供者:tatu11
  1. 基于角色标注的中国人名自动识别研究

  2.   该文提出了一种基于角色标注的中国人名自动识别方法.其基本思想是:根据在人名识别中的作用 ,采取 Viterbi 算法对切词结果进行角色标注 ,在角色序列的基础上 ,进行模式最大匹配 ,最终实现中国人名的识别.识别 过程中只需要将某个词作为特定角色的概率以及角色之间的转移概率.该方法的实用性还在于:这些角色信息完 全可以从真实语料库中自动抽取得到.通过对 16M字节真实语料库的封闭与开放测试 ,该方法取得了接近 98 %的 召回率.文中介绍了计算所汉语词法分析系统 ICTCLAS ,集成人名
  3. 所属分类:互联网

    • 发布日期:2011-04-18
    • 文件大小:439296
    • 提供者:yuqilong
  1. 语音识别技术文章.rar

  2. 第一部分 基本理论 第2章 听觉机理和汉语语音基础 2. 1 概述 2.2 听觉机理和心理 2.2.1 语音听觉器官的生理结构 2.2.2 语音听觉的心理 2.3 发音的生理机构与过程 2.4 汉语语音基本特性 2.4. 1 元音和辅音 2.4.2 声母和韵母 2.4.3 音调(字调) 2.4.4 音节(字)构成 2.4.5 汉语的波形特征 2.4.6 音的频谱特性 2.4.7 辅音的频谱特性 2.4.8 汉语语音的韵律特征 2.5 小结 参考文献 第3章 语音信号处理方法--时域处理 3.1
  3. 所属分类:其它

    • 发布日期:2011-05-12
    • 文件大小:5242880
    • 提供者:wangjunhui1984
  1. 灵玖LJCorpus中文语料库分析软件

  2. 语料库语言学是20世纪80年代才崭露头角的一门交叉学科,它研究自然语言文本的采集、存储、加工和统计分析,目的是凭借大规模语料库提供的客观翔实的语言证据来从事语言学研究和指导自然语言信息处理系统的开发。随着互联网的爆炸式增长,中文语料库的规模也随之剧增。语言学的研究面临着各类复杂的海量数据,亟需采用信息化的手段,自动分析相关的语言数据,从而更好地研究并开发使用的自然语言信息处理系统。
  3. 所属分类:其它

    • 发布日期:2011-08-07
    • 文件大小:12582912
    • 提供者:fw_1234
  1. 论文检测系统软件,免费分享 反抄袭

  2. 现在论文抄袭、学术打假成为学术界、媒体关注的话题。有的学者心存侥幸,有的学者对学术严谨性未加重视等,以至于被相关人士揭发举报,最终身败名裂。而许多毕业生因为种种原因,并未对论文抄袭现象加以重视,最后不能顺利毕业,荒废了几年时间,得不偿失。现在提供论文检测的机构主要来源于三大中文期刊数据库,即中国知网论文检测系统,万方论文相似性检测系统,维普通达检测系统。 现在应用较多的是中国知网和万方的检测系统,但是两者都不是免费的,其中,中国知网的费用相对高,在淘宝上一篇硕士论文的检测费用达到两百元。介于此
  3. 所属分类:教育

    • 发布日期:2012-03-03
    • 文件大小:3145728
    • 提供者:baidengdao
  1. 论文相似度检测系统软件

  2. 现在论文抄袭、学术打假成为学术界、媒体关注的话题。有的学者心存侥幸,有的学者对学术严谨性未加重视等,以至于被相关人士揭发举报,最终身败名裂。而许多毕业生因为种种原因,并未对论文抄袭现象加以重视,最后不能顺利毕业,荒废了几年时间,得不偿失。现在提供论文检测的机构主要来源于三大中文期刊数据库,即中国知网论文检测系统,万方论文相似性检测系统,维普通达检测系统。 现在应用较多的是中国知网和万方的检测系统,但是两者都不是免费的,其中,中国知网的费用相对高,在淘宝上一篇硕士论文的检测费用达到两百元。介于此
  3. 所属分类:其它

    • 发布日期:2013-10-04
    • 文件大小:3145728
    • 提供者:cscdn
  1. 手机评论文本语料库

  2. 商城手机评论文本,华为荣耀手机(2款手机评论文本),小米红米手机,OPPO手机各1000条,共4000条。可作为中文分类的训练语料库,用于情感分析,推荐系统等领域。最新的评论资源。
  3. 所属分类:其它

    • 发布日期:2018-01-04
    • 文件大小:1048576
    • 提供者:c3438727825
  1. 基频包络的音节聚类分析

  2. 对汉语TTS 系统的大规模语料库做了基本的韵律参数统计, 分析了音节的韵律特征与其所在的韵律结构位 置以及韵律结构边界的关系. 进一步, 对有调音节样本集基于基频包络采进行聚类, 通过听辨实验检验了聚类结果, 并分析了音节聚类与其所在韵律结构之间的对应关系
  3. 所属分类:专业指导

    • 发布日期:2008-12-30
    • 文件大小:261120
    • 提供者:aouming
  1. Coae中文微博语料库

  2. 中文微博语料库2014.包含COAE2014会议五个任务的评测数据,任务1 :面向新闻的情感关键句抽取与判定 在给定新闻集合(每篇文章已切成句子)中,判别每篇文章的情感关键句 。 任务2:跨语言情感倾向性分析 本任务是对给定多语言篇章级数据集 ,要求参加系统自动分析多语言篇章级数据集每个情感句的情感倾向性,即(褒义、贬义或者中性)。 任务3:微博情感新词发现与判定 本任务是对给定大规模的微博句子集 ,要求参赛系统自动发现新的词语( 不在给定的词典以内),以及每个词语的情感倾向性,即褒义、贬义或
  3. 所属分类:机器学习

    • 发布日期:2018-10-14
    • 文件大小:44040192
    • 提供者:qq_24435185
  1. 通过文本情感分析和识别技术可视化中文博客中的情感

  2. 近年来,关于博客情绪分析和识别的研究变得越来越重要。在这项研究中,我们基于中文博客情感语料库(Ren-CECps),从不同的文本级别(单词,句子和段落)分析并比较了博客情感可视化。然后,针对实际应用设计了博客情感可视化系统。机器学习方法适用于不同文本级别的博客情感识别的实现。基于情感识别引擎,博客情感可视化界面旨在提供更直观的博客情感显示,从而可以为博客作者检测情感并快速捕获情感变化。此外,我们通过比较五种不同模式下的分类算法对句子情感识别的性能进行了评估,从而证明了互补朴素贝叶斯模型对句子情感
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:2097152
    • 提供者:weixin_38624628
  1. 汉维医疗平行语料库构建及特征分析

  2. 面对稀缺、专业性强的汉维双语医疗平行语料库建设,本文探索数据采集、标准化、去噪、自动录入方法,进行语料库特征分析,并根据语料数据特性,设计语料库网页检索系统。目前已建成110多万字、2.6万句汉语医疗语料,3000句对汉维双语对齐语料,不仅对构建中小型语料库有参考价值,而且奠定了医疗自然语言处理研究基础,尤其汉维双语对齐语料,将促进机器翻译技术在医疗领域突破,对新疆边远地区无汉语表达能力的少数民族群众获得医疗救助搭建桥梁。
  3. 所属分类:其它

    • 发布日期:2021-03-14
    • 文件大小:1048576
    • 提供者:weixin_38746574
  1. pablobernabeu.github.io:网站https:pablobernabeu.github.io(请参阅https://github.compablobernabeuwebsite-files的后端文件)。 毕奥:在完成了心理

  2. pablobernabeu.github.io:网站https:pablobernabeu.github.io(请参阅https://github.compablobernabeuwebsite-files的后端文件)。 毕奥:在完成了心理语言学研究硕士学位之后,我现在是认知心理学的博士研究生和研究生助教。 我正在研究语言和感觉运动脑系统如何支持概念处理。 我使用行为和脑电图实验,语料库分析,统计和编程等方法
  3. 所属分类:其它

    • 发布日期:2021-02-23
    • 文件大小:63963136
    • 提供者:weixin_42097967
  1. Exmaralda-源码

  2. 埃玛拉达 EXMARaLDA是用于在计算机上处​​理口腔语料库的系统。 它由一个转录和注释工具(Partitur-Editor),一个用于管理语料库的工具(Corpus-Manager)以及一个查询和分析工具(EXAKT)组成。 EXMARaLDA的功能包括: 时间对齐的数字音频或视频灵活批注,可自由选择类别,通过元数据对语料库进行系统的文档化以各种布局和格式(批注,文档)灵活输出转录数据,计算机辅助查询抄录,批注和元数据它使用基于XML的数据格式,允许与其他工具(例如Praat,ELAN,
  3. 所属分类:其它

    • 发布日期:2021-02-17
    • 文件大小:95420416
    • 提供者:weixin_42103587
  1. 构建和剖析中英三元组可比语料库

  2. 由于受到翻译腔的影响,中英平行语料库存在固有的扭斜的语言模型。显然,用这样的语料库训练的机器翻译、跨语言检索等自然语言处理系统也承袭了扭斜的语言模型,严重影响到应用系统的性能。为了克服平行语料库固有的缺陷,本文提出了构建和剖析中英三元组可比语料库的技术研究。这项研究采用可比语料库和语言自动剖析技术,使用统计和规则相结合的方法,对由本族英语、中式英语和标准中文三元素所组成的三元组可比语料库中的本族英语和中式英语进行统计分析。在此基础上,利用n-元词串、关键词簇等自动抽取技术挖掘基于本族语言模型的双
  3. 所属分类:其它

    • 发布日期:2021-02-09
    • 文件大小:425984
    • 提供者:weixin_38601878
  1. PDF-Search-Engine-C-:这是用C ++创建的PDF搜索引擎,是南方卫理公会大学CSE2341数据结构课程的最终项目-源码

  2. C ++中的PDF搜索引擎 该程序是C ++编写的TF-IDF搜索引擎,用于南部卫理公会大学的CSE 2341最终项目。 UI是用ncurses制作的,并且使用Poppler C ++解析库来解析PDF。 可以使用哈希表和AVL树创建索引,但是两个索引都具有相对相似的解析和搜索时间。 用法 程序运行后,用法相对不言自明。 转到“添加文件”部分以添加PDF,将通过删除停用词,阻止词干并将其添加到指定的数据结构中来分析其内容。 该程序还列出了PDF语料库中最常用的单词。 正在搜寻 用户可以使用“搜索
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:562176
    • 提供者:weixin_42139252
  1. greekLit:一种在elasticsearch中索引古代语料库的系统-源码

  2. 规范希腊语 发展在正在发生。 这只是一面镜子。 建立 该存储库包含来自perseus的规范性greekLit集合作为子模块,因此在进行任何分析/索引之前,请初始化/更新子模块: git submodule update --init 第一遍: 解析本垒打正常,但尚未解析所有书籍中的所有行。 正在处理...: # gives back all lines of homers # represented as json data points ./greek_lit.rb 去做:
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:3072
    • 提供者:weixin_42179184
  1. ODSC_text_analysis:具有空间性和文本性的探索性文本分析材料-源码

  2. 使用spaCy和textacy在Python中进行探索性文本分析 斯科特·贝利(Scott Bailey) 数字研究与奖学金图书馆员版权和数字奖学金中心(CDSC) 北卡罗来纳州立大学图书馆 2021年东部开放数据科学会议讲习班 Python生态系统有许多用于自然语言处理(NLP)的库,这会使开始将文本作为数据进行分析变得令人困惑。 该研讨会将介绍spaCy,它是NLP的强大而自以为是的库,可促进文本数据的分析,而textacy是增加信息检索和语料库分析功能的库。 通过完成此研讨会,您将开发核
  3. 所属分类:其它

    • 发布日期:2021-03-28
    • 文件大小:11534336
    • 提供者:weixin_42115003
« 12 3 »