搜索资源 - 语料库分析系统 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 语料库分析系统

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

信息检索研究室论文集第一卷
信息检索相关论文集合一 1. 车万翔刘挺秦兵李生面向依存分析的搭配抽取方法研究 1 全国第六届计算语言学联合学术会议, 2001, 7 Collocation Extraction Oriented to Dependency Parsing 2. 秦兵郑实福刘挺张刚李生基于改进的贝叶斯模型的中文网页分类器 8 全国第六届计算语言学联合学术会议, 2001, 7 An Improved Bayes Classifier for Chinese Web Pages 3. 张刚
所属分类：Web开发
- 发布日期：2009-08-04
- 文件大小：1048576
- 提供者：chenls

LJCorpus中文语料库分析软件
LJCorpus试用版本下载地址下载地址：http://www.lingjoin.com/download/LJCorpus.rar 介绍： LJCorpus中文语料库分析软件是一套专门针对中文生语料库的加工、抽取、统计与翻译全自动的综合语料分析系统，应用了领先的汉语词法分析技术、新词发现技术、统计挖掘技术以及词语翻译对齐技术，目前，东北师范大学中文系已经成功应用该软件对新加坡的语言进行了分析，极大提高了研究的效率。 LJCorpus中文语料库分析软件的四大功能主要包括： 1. 新词发现：
所属分类：专业指导
- 发布日期：2010-04-17
- 文件大小：12582912
- 提供者：lingjoin

计算机自然语言理解98年1月人民日报某语料库
语料库通常指为语言研究收集的、用电子形式保存的语言材料，由自然出现的书面语或口语的样本汇集而成，用来代表特定的语言或语言变体。经过科学选材和标注、具有适当规模的语料库能够反映和记录语言的实际使用情况。人们通过语料库观察和把握语言事实，分析和研究语言系统的规律。语料库已经成为语言学理论研究、应用研究和语言工程不可缺少的基础资源。
所属分类：专业指导
- 发布日期：2010-04-17
- 文件大小：2097152
- 提供者：wssgcsc

LJCorpus语料分析软件
这个软件可以对设定的语料库分词，提词，频度分析。便于语料的处理
所属分类：专业指导
- 发布日期：2010-11-29
- 文件大小：12582912
- 提供者：tatu11

基于角色标注的中国人名自动识别研究
　该文提出了一种基于角色标注的中国人名自动识别方法.其基本思想是:根据在人名识别中的作用 ,采取 Viterbi 算法对切词结果进行角色标注 ,在角色序列的基础上 ,进行模式最大匹配 ,最终实现中国人名的识别.识别过程中只需要将某个词作为特定角色的概率以及角色之间的转移概率.该方法的实用性还在于:这些角色信息完全可以从真实语料库中自动抽取得到.通过对 16M字节真实语料库的封闭与开放测试 ,该方法取得了接近 98 %的召回率.文中介绍了计算所汉语词法分析系统 ICTCLAS ,集成人名
所属分类：互联网
- 发布日期：2011-04-18
- 文件大小：439296
- 提供者：yuqilong

语音识别技术文章.rar
第一部分基本理论第2章听觉机理和汉语语音基础 2. 1 概述 2.2 听觉机理和心理 2.2.1 语音听觉器官的生理结构 2.2.2 语音听觉的心理 2.3 发音的生理机构与过程 2.4 汉语语音基本特性 2.4. 1 元音和辅音 2.4.2 声母和韵母 2.4.3 音调(字调) 2.4.4 音节(字)构成 2.4.5 汉语的波形特征 2.4.6 音的频谱特性 2.4.7 辅音的频谱特性 2.4.8 汉语语音的韵律特征 2.5 小结参考文献第3章语音信号处理方法--时域处理 3.1
所属分类：其它
- 发布日期：2011-05-12
- 文件大小：5242880
- 提供者：wangjunhui1984

灵玖LJCorpus中文语料库分析软件
语料库语言学是20世纪80年代才崭露头角的一门交叉学科，它研究自然语言文本的采集、存储、加工和统计分析，目的是凭借大规模语料库提供的客观翔实的语言证据来从事语言学研究和指导自然语言信息处理系统的开发。随着互联网的爆炸式增长，中文语料库的规模也随之剧增。语言学的研究面临着各类复杂的海量数据，亟需采用信息化的手段，自动分析相关的语言数据，从而更好地研究并开发使用的自然语言信息处理系统。
所属分类：其它
- 发布日期：2011-08-07
- 文件大小：12582912
- 提供者：fw_1234

论文检测系统软件，免费分享反抄袭
现在论文抄袭、学术打假成为学术界、媒体关注的话题。有的学者心存侥幸，有的学者对学术严谨性未加重视等，以至于被相关人士揭发举报，最终身败名裂。而许多毕业生因为种种原因，并未对论文抄袭现象加以重视，最后不能顺利毕业，荒废了几年时间，得不偿失。现在提供论文检测的机构主要来源于三大中文期刊数据库，即中国知网论文检测系统，万方论文相似性检测系统，维普通达检测系统。现在应用较多的是中国知网和万方的检测系统，但是两者都不是免费的，其中，中国知网的费用相对高，在淘宝上一篇硕士论文的检测费用达到两百元。介于此
所属分类：教育
- 发布日期：2012-03-03
- 文件大小：3145728
- 提供者：baidengdao

论文相似度检测系统软件
现在论文抄袭、学术打假成为学术界、媒体关注的话题。有的学者心存侥幸，有的学者对学术严谨性未加重视等，以至于被相关人士揭发举报，最终身败名裂。而许多毕业生因为种种原因，并未对论文抄袭现象加以重视，最后不能顺利毕业，荒废了几年时间，得不偿失。现在提供论文检测的机构主要来源于三大中文期刊数据库，即中国知网论文检测系统，万方论文相似性检测系统，维普通达检测系统。现在应用较多的是中国知网和万方的检测系统，但是两者都不是免费的，其中，中国知网的费用相对高，在淘宝上一篇硕士论文的检测费用达到两百元。介于此
所属分类：其它
- 发布日期：2013-10-04
- 文件大小：3145728
- 提供者：cscdn

手机评论文本语料库
商城手机评论文本，华为荣耀手机（2款手机评论文本），小米红米手机，OPPO手机各1000条，共4000条。可作为中文分类的训练语料库，用于情感分析，推荐系统等领域。最新的评论资源。
所属分类：其它
- 发布日期：2018-01-04
- 文件大小：1048576
- 提供者：c3438727825

基频包络的音节聚类分析
对汉语TTS 系统的大规模语料库做了基本的韵律参数统计, 分析了音节的韵律特征与其所在的韵律结构位置以及韵律结构边界的关系. 进一步, 对有调音节样本集基于基频包络采进行聚类, 通过听辨实验检验了聚类结果, 并分析了音节聚类与其所在韵律结构之间的对应关系
所属分类：专业指导
- 发布日期：2008-12-30
- 文件大小：261120
- 提供者：aouming

Coae中文微博语料库
中文微博语料库2014.包含COAE2014会议五个任务的评测数据，任务1 ：面向新闻的情感关键句抽取与判定在给定新闻集合（每篇文章已切成句子）中，判别每篇文章的情感关键句。任务2：跨语言情感倾向性分析本任务是对给定多语言篇章级数据集，要求参加系统自动分析多语言篇章级数据集每个情感句的情感倾向性，即（褒义、贬义或者中性）。任务3：微博情感新词发现与判定本任务是对给定大规模的微博句子集，要求参赛系统自动发现新的词语（不在给定的词典以内），以及每个词语的情感倾向性，即褒义、贬义或
所属分类：机器学习
- 发布日期：2018-10-14
- 文件大小：44040192
- 提供者：qq_24435185

通过文本情感分析和识别技术可视化中文博客中的情感
近年来，关于博客情绪分析和识别的研究变得越来越重要。在这项研究中，我们基于中文博客情感语料库（Ren-CECps），从不同的文本级别（单词，句子和段落）分析并比较了博客情感可视化。然后，针对实际应用设计了博客情感可视化系统。机器学习方法适用于不同文本级别的博客情感识别的实现。基于情感识别引擎，博客情感可视化界面旨在提供更直观的博客情感显示，从而可以为博客作者检测情感并快速捕获情感变化。此外，我们通过比较五种不同模式下的分类算法对句子情感识别的性能进行了评估，从而证明了互补朴素贝叶斯模型对句子情感
所属分类：其它
- 发布日期：2021-03-18
- 文件大小：2097152
- 提供者：weixin_38624628

汉维医疗平行语料库构建及特征分析
面对稀缺、专业性强的汉维双语医疗平行语料库建设，本文探索数据采集、标准化、去噪、自动录入方法，进行语料库特征分析，并根据语料数据特性，设计语料库网页检索系统。目前已建成110多万字、2.6万句汉语医疗语料，3000句对汉维双语对齐语料，不仅对构建中小型语料库有参考价值，而且奠定了医疗自然语言处理研究基础，尤其汉维双语对齐语料，将促进机器翻译技术在医疗领域突破，对新疆边远地区无汉语表达能力的少数民族群众获得医疗救助搭建桥梁。
所属分类：其它
- 发布日期：2021-03-14
- 文件大小：1048576
- 提供者：weixin_38746574

pablobernabeu.github.io：网站https：pablobernabeu.github.io（请参阅https：//github.compablobernabeuwebsite-files的后端文件）。毕奥：在完成了心理
pablobernabeu.github.io：网站https：pablobernabeu.github.io（请参阅https：//github.compablobernabeuwebsite-files的后端文件）。毕奥：在完成了心理语言学研究硕士学位之后，我现在是认知心理学的博士研究生和研究生助教。我正在研究语言和感觉运动脑系统如何支持概念处理。我使用行为和脑电图实验，语料库分析，统计和编程等方法
所属分类：其它
- 发布日期：2021-02-23
- 文件大小：63963136
- 提供者：weixin_42097967

Exmaralda-源码
埃玛拉达 EXMARaLDA是用于在计算机上处理口腔语料库的系统。它由一个转录和注释工具（Partitur-Editor），一个用于管理语料库的工具（Corpus-Manager）以及一个查询和分析工具（EXAKT）组成。 EXMARaLDA的功能包括：时间对齐的数字音频或视频灵活批注，可自由选择类别，通过元数据对语料库进行系统的文档化以各种布局和格式（批注，文档）灵活输出转录数据，计算机辅助查询抄录，批注和元数据它使用基于XML的数据格式，允许与其他工具（例如Praat，ELAN，
所属分类：其它
- 发布日期：2021-02-17
- 文件大小：95420416
- 提供者：weixin_42103587

构建和剖析中英三元组可比语料库
由于受到翻译腔的影响，中英平行语料库存在固有的扭斜的语言模型。显然，用这样的语料库训练的机器翻译、跨语言检索等自然语言处理系统也承袭了扭斜的语言模型，严重影响到应用系统的性能。为了克服平行语料库固有的缺陷，本文提出了构建和剖析中英三元组可比语料库的技术研究。这项研究采用可比语料库和语言自动剖析技术，使用统计和规则相结合的方法，对由本族英语、中式英语和标准中文三元素所组成的三元组可比语料库中的本族英语和中式英语进行统计分析。在此基础上，利用n-元词串、关键词簇等自动抽取技术挖掘基于本族语言模型的双
所属分类：其它
- 发布日期：2021-02-09
- 文件大小：425984
- 提供者：weixin_38601878

PDF-Search-Engine-C-：这是用C ++创建的PDF搜索引擎，是南方卫理公会大学CSE2341数据结构课程的最终项目-源码
C ++中的PDF搜索引擎该程序是C ++编写的TF-IDF搜索引擎，用于南部卫理公会大学的CSE 2341最终项目。 UI是用ncurses制作的，并且使用Poppler C ++解析库来解析PDF。可以使用哈希表和AVL树创建索引，但是两个索引都具有相对相似的解析和搜索时间。用法程序运行后，用法相对不言自明。转到“添加文件”部分以添加PDF，将通过删除停用词，阻止词干并将其添加到指定的数据结构中来分析其内容。该程序还列出了PDF语料库中最常用的单词。正在搜寻用户可以使用“搜索
所属分类：其它
- 发布日期：2021-02-04
- 文件大小：562176
- 提供者：weixin_42139252

greekLit：一种在elasticsearch中索引古代语料库的系统-源码
规范希腊语发展在正在发生。这只是一面镜子。建立该存储库包含来自perseus的规范性greekLit集合作为子模块，因此在进行任何分析/索引之前，请初始化/更新子模块： git submodule update --init 第一遍：解析本垒打正常，但尚未解析所有书籍中的所有行。正在处理...： # gives back all lines of homers # represented as json data points ./greek_lit.rb 去做：
所属分类：其它
- 发布日期：2021-02-04
- 文件大小：3072
- 提供者：weixin_42179184

ODSC_text_analysis:具有空间性和文本性的探索性文本分析材料-源码
使用spaCy和textacy在Python中进行探索性文本分析斯科特·贝利（Scott Bailey）数字研究与奖学金图书馆员版权和数字奖学金中心（CDSC）北卡罗来纳州立大学图书馆 2021年东部开放数据科学会议讲习班 Python生态系统有许多用于自然语言处理（NLP）的库，这会使开始将文本作为数据进行分析变得令人困惑。该研讨会将介绍spaCy，它是NLP的强大而自以为是的库，可促进文本数据的分析，而textacy是增加信息检索和语料库分析功能的库。通过完成此研讨会，您将开发核
所属分类：其它
- 发布日期：2021-03-28
- 文件大小：11534336
- 提供者：weixin_42115003

« 12 3 »