搜索资源 - 构建训练集 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 构建训练集

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

构建Hadoop分布式集群环境
王家林的“云计算分布式大数据Hadoop实战高手之路---从零开始”的第四讲Hadoop图文训练课程：构建真正的Hadoop分布式集群环境
所属分类：3G/移动开发
- 发布日期：2013-06-14
- 文件大小：2097152
- 提供者：javaniceyou

用于构造决策树的小数据集
数据挖掘概念与技术课本P218页数据表格式为.csv。。决策树一般采用贪心策略**自顶向下**递归的分治方式构造，从训练元组集和与之相关联的类标号开始，随着树的构建，训练集递归地划分成较小的子集。构造过程大致如下： 1. 构造**根结点**，根据**属性选择度量**（例如ID3的信息增益）来选择合适的属性作为根结点。 2. 根据根结点的属性值（可能是离散的，连续的或二值的）**分枝**，每个分枝代表元组在该属性下可能满足的条件。
所属分类：机器学习
- 发布日期：2018-04-16
- 文件大小：496
- 提供者：weixin_40170902

基于远程监督快速构信息抽取训练集
这是VLDB 2018的best paper，强烈推荐，在快速训练集方面非常有用！
所属分类：机器学习
- 发布日期：2018-09-26
- 文件大小：792576
- 提供者：haiyunj

opencv火焰识别级联训练器
OpenCV 自带了训练器和检测器。通过opencv构建出的火焰识别的训练集。Cascade Classifier Training OpenCV 已经包含了很多已经训练好的分类器，但没有火焰的训练器
所属分类：机器学习
- 发布日期：2018-11-30
- 文件大小：4096
- 提供者：winterredrain

基于深度学习的领域情感词典自动构建_——以金融领域为例.pdf
基于深度学习的领域情感词典自动构建_——以金融领域为例。摘要：【目的】为特定领域情感分析任务构建一个适用的情感词典。【方法】以金融领域为例, 结合语料库和知识库的特点, 提出一种全新的构建情感词典的方法: 利用词向量方法将文本信息映射到向量空间, 借助已有的通用情感词典, 自动标引训练语料, 按照9:1的比例构建训练集和预测集。使用Python构建深度神经网络分类器, 判断特定领域候选情感词的情感极性, 构成情感词典。【结果】本文构建的神经网络分类器的训练集准确度为 95.02%, 预
所属分类：金融
- 发布日期：2019-10-02
- 文件大小：608256
- 提供者：june_hjx

独立成分分析在瓦斯浓度预测中的应用研究
为提高含噪声瓦斯浓度数据的预测精度,提出了一种基于独立成分分析(ICA)和k-最近邻(kNN)法的反向传播人工神经网络(BP-ANN)预测模型。利用滑动时间窗算法产生训练样本矩阵,采用ICA方法估计训练样本矩阵中的独立成分,用不含噪声的独立成分重新构建训练集;运用k-NN法减小训练集规模,引入混合距离测度函数降低训练过程的计算复杂度。实验结果表明,该预测模型较普通BP-ANN模型有效减小了瓦斯浓度预测误差和训练时间。
所属分类：其它
- 发布日期：2020-05-11
- 文件大小：242688
- 提供者：weixin_38724611

基于视觉信息和深度学习的中文唇语数据集构建与识别_胡扬.caj
本文以中文唇语识别为主线，通过更有效的数据收集手段将中文的唇语识别问题拓展到更一般更现实的中文环境中，并通过深度学习技术有效解决现实环境下变长唇语序列图片的中文识别问题。本文的主要研究内容包括： 1. 研究以互联网视频为数据源头，自动快速构建中文唇语数据集的方法。互联网视频中的场景变化较多，与现实环境相符，同时资源获取成本较低，本文基于此，提出有效的从互联网视频中获取可以用于训练唇读模型的唇部序列图片和对应的中文内容。 2. 研究中文唇语识别的网络设计。相较于限定实验环境下的唇
所属分类：深度学习
- 发布日期：2020-04-27
- 文件大小：1048576
- 提供者：zhr_the_great

LCQMC数据集.tar.gz
LCQMC 是哈尔滨工业大学在自然语言处理国际顶会 COLING2018 构建的问题语义匹配数据集，其目标是判断两个问题的语义是否相同。构建的方式是先针对不同的领域从百度问答中抽取高频的相关问题，然后通过Wasserstein distance进行初步筛选，最后人工进行标注。数据集一共有260068对标注结果，分为三部分，238766训练集、8802验证集和12500测试集。
所属分类：深度学习
- 发布日期：2020-04-24
- 文件大小：6291456
- 提供者：tcd1112

语义相似度任务数据训练集、验证集、测试集。LCQMC
语义相似度任务数据训练集、验证集、测试集。LCQMC 是哈尔滨工业大学在自然语言处理国际顶会 COLING2018 构建的问题语义匹配数据集，用于判断两个问题的语义是否相同。
所属分类：互联网
- 发布日期：2020-04-21
- 文件大小：6291456
- 提供者：pengpengchaoren

化合物肝毒性预测模型的构建及应用研究
化合物肝毒性预测模型的构建及应用研究，陈潜，范骁辉，目的：建立一种快速且低成本的化合物肝毒性计算预测方法。方法：根据文献收集整理50个肝毒化合物和63个无肝毒化合物组成训练集，�
所属分类：其它
- 发布日期：2020-02-23
- 文件大小：390144
- 提供者：weixin_38625048

PyTorch 模型训练实用教程
本教程内容主要为在 PyTorch 中训练一个模型所可能涉及到的方法及函数，并且对 PyTorch 提供的数据增强方法（22 个）、权值初始化方法（10 个）、损失函数（17 个）、优化器（6 个）及 tensorboardX 的方法（13 个）进行了详细介绍，本教程分为四章，结构与机器学习三大部分一致。第一章，介绍数据的划分，预处理，数据增强；第二章，介绍模型的定义，权值初始化，模型 Finetune；第三章，介绍各种损失函数及优化器；第四章，介绍可视化工具，用于监控数
所属分类：机器学习
- 发布日期：2019-03-03
- 文件大小：4194304
- 提供者：qq_29893385

keras自定义回调函数查看训练的loss和accuracy方式
前言： keras是一个十分便捷的开发框架，为了更好的追踪网络训练过程中的损失函数loss和准确率accuracy，我们有几种处理方式，第一种是直接通过 history=model.fit()，来返回一个history对象，通过这个对象可以访问到训练过程训练集的loss和accuracy以及验证集的loss和accuracy。第二种方式就是通过自定义一个回调函数Call backs，来实现这一功能，本文主要讲解第二种方式。一、如何构建回调函数Callbacks 本文所针对的例子是卷积神经网络
所属分类：其它
- 发布日期：2020-12-17
- 文件大小：83968
- 提供者：weixin_38557095

TensorFlow2.X使用图片制作简单的数据集训练模型
Tensorflow内置了许多数据集，但是实际自己应用的时候还是需要使用自己的数据集，这里TensorFlow 官网也给介绍文档，官方文档。这里对整个流程做一个总结（以手势识别的数据集为例）。 1、收集手势图片数据集下载方法多种多样了。我通过摄像头自己采集了一些手势图片。保存成如下形式，以同样的形式在建立一个测试集，当然也可以不弄，在程序里处理。 2、构建数据集导入相关的包 import tensorflow as tf from tensorflow import keras f
所属分类：其它
- 发布日期：2020-12-20
- 文件大小：154624
- 提供者：weixin_38668335

ml-project:使用movielens数据集推荐电影-源码
data/提供了一个存储项目原始数据和处理数据的地方。您还可以包含描述项目数据的data/README.md文件。 docker/是为项目指定一个或多个Dockerfile的地方。 Docker（和其他容器解决方案）有助于确保多台机器和部署之间的行为一致。 api/app.py通过REST客户端公开模型以进行预测。您可能会选择从加载（训练后的）模型，而不是直接从库中导入。 models/定义了该任务的机器学习模型的集合，这些模型由base.py定义的通用API统一。这些模型包括用于任何必要
所属分类：其它
- 发布日期：2021-03-18
- 文件大小：3072
- 提供者：weixin_42120405

贝叶斯模型构建分类器的设计与实现
于半月前，针对文本分类进行学习，实验的目的是通过对下图1中的不同情感文本构建训练集模型，对应的下图2是对训练集的注释说明。类标0开头为喜悦类别，类标1开头的为愤怒类别，类别2开头的是厌恶类别，类别3开头的为低落类别。4个训练集文本，分别对应4个分类。如何通过训练集构造分类器，并对测试数据进行验证是本课题的最终目的。其中会涉及贝叶斯公式的理解与实现，文本的预处理（下图1中0_simplifyweibo的训练集是处理过的数据如下图），分词工具的使用，不同贝叶斯模型的构造，试验结果对比。核心思路就两点
所属分类：其它
- 发布日期：2021-02-24
- 文件大小：184320
- 提供者：weixin_38514805

旋转森林的一种变体，用于构建整体分类器
旋转森林是一种有效的整体分类器生成技术，其工作原理是使用主成分分析（PCA）旋转原始特征轴，以便可以形成用于学习基础分类器的不同训练集。本文介绍了旋转林的一种变体，可以将其视为装袋和旋转林的组合。在这里，使用装袋将更多的随机性注入到“旋转森林”中，以增加整体成员之间的灵活性。使用UCI储存库中的33个基准分类数据集进行的实验（其中采用分类树作为基础学习算法）表明，该方法产生的整体分类器的错误率低于Bagging，AdaBoost和Rotation Forest。误差性能的偏差-方差分析表
所属分类：其它
- 发布日期：2021-02-22
- 文件大小：922624
- 提供者：weixin_38686557

spam-filter-with-naive-bayes：使用多名词朴素贝叶斯算法构建垃圾邮件SMS过滤器-源码
天真贝叶斯垃圾邮件过滤器使用多名词朴素贝叶斯算法构建垃圾邮件SMS过滤器链接到Jupyter Notebook：该项目致力于使用已经被人类分类的5,572条SMS消息的数据集来构建垃圾邮件过滤器。数据集的80％被用作训练集，而20％被用作测试集。 “过滤器”实现了98.7％的分类精度。
所属分类：其它
- 发布日期：2021-02-14
- 文件大小：214016
- 提供者：weixin_42125826

mlflow-example：此存储库提供了一个示例示例，该示例使用MLflow跟踪，项目和模型模块在容器化环境中进行数据集预处理，GBRT（梯度增强回归树）模型训练和评估，模型调整以及最终模型服务（REST API）-源码
MLflow示例项目+笔记本该存储库提供了使用MLflow跟踪，项目和模型模块在容器化环境中进行数据集预处理，模型训练和评估，模型调整以及最终模型服务（REST API）的示例。该项目包含一个MLflow项目，该项目在UC Irvine的上训练GBRT（梯度增强的回归树）模型，并使用Docker映像捕获运行训练和推理代码所需的依赖项。对话：：演讲幻灯片：笔记本：该项目的结构指定运行项目的Docker容器环境，并在entry_points定义command和parame
所属分类：其它
- 发布日期：2021-02-04
- 文件大小：4194304
- 提供者：weixin_42129300

贝叶斯模型构建分类器的设计与实现
于半月前，针对文本分类进行学习，实验的目的是通过对下图1中的不同情感文本构建训练集模型，对应的下图2是对训练集的注释说明。类标0开头为喜悦类别，类标1开头的为愤怒类别，类别2开头的是厌恶类别，类别3开头的为低落类别。4个训练集文本，分别对应4个分类。如何通过训练集构造分类器，并对测试数据进行验证是本课题的最终目的。其中会涉及贝叶斯公式的理解与实现，文本的预处理（下图1中0_simplifyweibo的训练集是处理过的数据如下图），分词工具的使用，不同贝叶斯模型的构造，试验结果对比。核心思路就两点
所属分类：其它
- 发布日期：2021-01-27
- 文件大小：184320
- 提供者：weixin_38589150

Tensorflow2.0：加载与识别经典数据集MINIST
一实现思路 1. 加载 MNIST 数据集，得到训练集与测试集 2. 将训练集与测试集转换为DataSet对象 3. 将数据顺序打散避免每次读取数据顺序相同，使得模型记住训练集的一些特点，降低模型泛化能力。 4. 设置批训练从训练集总数中随机抽取batchsize个样本，来进行模型训练，相比于使用所用样本构建模型，批训练花费的时间更少，计算效率更高。每训练一个次，就叫一个step，当经历若干个step使得把训练集所有样本训练过以后，那叫一个epoch 5. 数据预处理图片像素值进行标准化
所属分类：其它
- 发布日期：2021-01-20
- 文件大小：73728
- 提供者：weixin_38746818

« 12 3 4 5 6 7 8 9 10 ... 25 »