搜索资源 - 标记语料 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 标记语料

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

新闻语料的标记与分词——自然语言处理
该函数通过标记的机构名，人名，地名，然后来辨别大陆，港澳台，西方，日本，韩国的国籍
所属分类：C++
- 发布日期：2009-11-10
- 文件大小：2097152
- 提供者：peifei_go

分词词性标记语料
分词词性标记语料
所属分类：机器学习
- 发布日期：2017-06-21
- 文件大小：52428800
- 提供者：loveysuxin

自然语言处理语料库标注集以及符号说明
花费大量时间搜集的自然语言处理语料库标注集，包括词性标注集、命名实体识别BIO标注、中文组块分析chunk标记。
所属分类：机器学习
- 发布日期：2017-12-09
- 文件大小：168960
- 提供者：wustjk124

汉语语料库加工规范
《现代汉语语料库加工规范——词语切分与词性标注》词性标记
所属分类：搜索引擎
- 发布日期：2018-01-12
- 文件大小：171008
- 提供者：johnson219

新浪微博，情感分析标记语料共12万条
本资源为自己人工标记的微博语料，分为消极pos.txt，积极neg.txt 各60000条，适用于机器学习情感分析，训练数据原数据
所属分类：机器学习
- 发布日期：2018-01-19
- 文件大小：8388608
- 提供者：weixin_38442818

命名实体识别标记语料
已经标记号label的中文命名实体识别的语料库，采用BIM标志形式。包括人名（PERSON）、地点（LOCATION）、时间（TIME）及机构名（ORGANIZATION）。
所属分类：机器学习
- 发布日期：2018-11-22
- 文件大小：17825792
- 提供者：sinat_33864860

新浪微博，情感分析标记语料共12万条
本资源为自己人工标记的微博语料，分为消极pos.txt，积极neg.txt 各60000条，适用于机器学习情感分析，训练数据原数据
所属分类：机器学习
- 发布日期：2019-01-02
- 文件大小：8388608
- 提供者：yujalay

新浪微博，情感分析标记语料共12万条
本资源为自己人工标记的微博语料，分为消极pos.txt，积极neg.txt 各60000条，适用于机器学习情感分析，训练数据原数据
所属分类：机器学习
- 发布日期：2019-02-18
- 文件大小：8388608
- 提供者：treesouth

实体识别标签展示样例2_新闻事件_赛莉®中文语料自动标注
BOTSALLY® 赛莉®中文语料自动标注的实体和事件辅助自动标注系统将实体抽取并标记出来，实体的在事件内的标签是ACE2005的标准，实体在文档切分标注中的标签是GB/T20532-2006标准。全文保持细粒度切分，采用XML的数据格式保存切分数据和切分信息。
所属分类：深度学习
- 发布日期：2020-04-07
- 文件大小：16384
- 提供者：weixin_44038242

新浪微博，情感分析标记语料共12万条
本资源为自己人工标记的微博语料，分为消极pos.txt，积极neg.txt 各60000条，适用于机器学习情感分析，训练数据原数据
所属分类：机器学习
- 发布日期：2020-02-21
- 文件大小：8388608
- 提供者：p0082743

基于语料库的语义韵律和“似乎”的语义偏好研究
本文是对“似乎”的语义韵律和偏好进行基于语料库的分析，以更详细地了解标记所表达的功能。 “似乎”（外观动词，证据标记，对冲概率，指示传闻等）的多功能性受到了广泛关注（Aijmer，2009； Usonien？＆Jolanta，2013； Langacker，2017； Marin，2017等）。），尽管很少有研究（如果有的话）研究其轮廓意义的问题，因此，该实证研究旨在探讨语义上的韵律和“似乎”的偏好，以此作为确定其主要功能的指标。重点在于检查“似乎”的语义韵律，语义偏好和搭配，以帮助确定其主
所属分类：其它
- 发布日期：2020-06-03
- 文件大小：232448
- 提供者：weixin_38688820

话语标记“拉倒”演化轨迹及其修辞功能探究
“拉倒”在现代汉语中使用频率很高,已基本具备了话语标记的基本特征,可以视为一个话语标记。通过对北京大学汉语语言学研究中心CCL语料库的语料进行分析,对作为话语标记的“拉倒”的演化轨迹进行探讨,较为详细地分析了其修辞功能,以期通过对一批不同类型的话语标记展开同样的研究,从而为修辞学开启一条新的研究途径。
所属分类：其它
- 发布日期：2020-06-15
- 文件大小：164864
- 提供者：weixin_38717980

新浪微博，情感分析标记语料共12万条
本资源为自己人工标记的微博语料，分为消极pos.txt，积极neg.txt 各60000条，适用于机器学习情感分析，训练数据原数据
所属分类：机器学习
- 发布日期：2020-06-24
- 文件大小：8388608
- 提供者：chelsea131

国内外话语标记语研究现状及趋势
话语标记语是依存于前言后语、划分说话单位的界标,是会话及写作中常见的语言现象,也是交际中具有一定语用功能的词语或结构,已成为国内外会话分析和语用研究中一个重要的探讨课题。简述话语标记语的兴起,通过介绍国外话语标记语的两个主要研究派别,探究各派代表人物、主要理论思想及其主要研究成果。从国内话语标记语的研究现状发现,国内研究主要是以语料库为研究工具按照口、笔语语料进行分类,指出目前我国国内话语标记语研究所存在的一些局限性及逐渐形成的研究趋势。
所属分类：其它
- 发布日期：2020-06-20
- 文件大小：135168
- 提供者：weixin_38601446

基于语料库的大学英语示范课中教师课堂话语语块特征研究
在二语习得、话语分析和短语学相关理论框架内,结合以往此类研究的质性分析方法和语料库量化分析方法,通过考察大学英语教师参加示范课教学的视频及转写文本,并辅以问卷调查和访谈等形式,对教师课堂话语的话语量、词汇特征、语块总体特征和话语标记语块特征进行了探讨分析,以期帮助广大大学英语教师关注和审视课堂上教师话语的使用现状和存在的问题,进而改进并提高课堂话语质量,提升课堂交际和教学效果。
所属分类：其它
- 发布日期：2020-07-09
- 文件大小：226304
- 提供者：weixin_38537777

GMB（Groningen Meaning Bank）语料
这是GMB语料库的摘录，经过标记，注释和构建，专门用于训练分类器以预测命名实体，例如名称，位置等。使用GMB（Groningen Meaning Bank）语料库进行命名实体识别的带注释语料库，该语料库通过自然语言处理将具有增强和流行特征的实体分类应用于数据集。
所属分类：机器学习
- 发布日期：2020-08-26
- 文件大小：25165824
- 提供者：weixin_42691585

199801已标记词性.txt
该资源是以1998年人民日报语料为对象，由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。
所属分类：互联网
- 发布日期：2020-11-17
- 文件大小：2097152
- 提供者：weixin_41862755

efaqa-corpus-zh::red_heart:Emotional急救数据集，心理咨询问答，聊天机器人语料库-源码
情绪急救数据集心理咨询问答语言料库，仅限研究用途。为什么发布这个语料库心理咨询中应用人工智能，是我们认为非常有价值的一个探索。我们愿意和更多人合作，把目前领先的人工智能技术，在心理咨询不同场景定位地。扣门的，就给他开门，愿每个人都有自己的心理咨询师。 - 数据集介绍心理咨询问答语料库（以下也称为“数据集”，“语料库”）是为应用人工智能技术于心理咨询领域制作的语料。据我们所知，这是心理咨询领域首个开放的QA语料库，包括20,000条心理咨询数据，也是公开的最大的中文心理咨询对话语料。数据
所属分类：其它
- 发布日期：2021-03-20
- 文件大小：7340032
- 提供者：weixin_42164534

斯坦福自然语言推理（SNLI）语料库-数据集
SNLI语料库（1.0版）是一个570k人工编写的英语句子对的集合，这些句子对经过手动标记以实现平衡分类，并带有enume，矛盾和中性标签，支持自然语言推理（NLI）的任务，也称为识别文本蕴涵（RTE）。可用于探索知识图谱推理、长短期记忆神经网络。数据集来自斯坦福自然语言处理小组。斯坦福自然语言推理（SNLI）语料库_datasets.txt 斯坦福自然语言推理（SNLI）语料库_datasets.zip
所属分类：其它
- 发布日期：2021-03-19
- 文件大小：94371840
- 提供者：weixin_38623707

plagiarism_detection:窃检测器，用于检查文本文件并执行二进制分类；将文件标记为抄袭还是不抄袭，取决于文本文件与提供的源文本的相似程度-源码
抄袭项目，机器学习部署该存储库包含用于使用AWS SageMaker部署a窃检测器的代码和相关文件。项目概况在这个项目中，您将负责构建a窃检测器，该检测器将检查文本文件并执行二进制分类。根据该文本文件与提供的源文本的相似程度，将该文件标记为抄袭或不抄袭。侦查窃是一个活跃的研究领域。这项任务很艰巨，解释的答案和原始作品之间的差异通常并不那么明显。该项目将分为三个主要笔记本：笔记本1：数据探索加载of窃文本数据的语料库。探索现有的数据功能和数据分布。这第一台笔记本是不是
所属分类：其它
- 发布日期：2021-03-15
- 文件大小：512000
- 提供者：weixin_42137032

« 12 3 4 5 »