您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 构建Hadoop分布式集群环境

  2. 王家林的“云计算分布式大数据Hadoop实战高手之路---从零开始”的第四讲Hadoop图文训练课程:构建真正的Hadoop分布式集群环境
  3. 所属分类:3G/移动开发

    • 发布日期:2013-06-14
    • 文件大小:2097152
    • 提供者:javaniceyou
  1. 用于构造决策树的小数据集

  2. 数据挖掘概念与技术课本P218页数据表格式为.csv。。决策树一般采用贪心策略**自顶向下**递归的分治方式构造,从训练元组集和与之相关联的类标号开始,随着树的构建,训练集递归地划分成较小的子集。构造过程大致如下: 1. 构造**根结点**,根据**属性选择度量**(例如ID3的信息增益)来选择合适的属性作为根结点。 2. 根据根结点的属性值(可能是离散的,连续的或二值的)**分枝**,每个分枝代表元组在该属性下可能满足的条件。
  3. 所属分类:机器学习

  1. 基于远程监督快速构信息抽取训练集

  2. 这是VLDB 2018的best paper,强烈推荐,在快速训练集方面非常有用!
  3. 所属分类:机器学习

    • 发布日期:2018-09-26
    • 文件大小:792576
    • 提供者:haiyunj
  1. opencv火焰识别级联训练器

  2. OpenCV 自带了训练器和检测器。通过opencv构建出的火焰识别的训练集。Cascade Classifier Training OpenCV 已经包含了很多已经训练 好的分类器,但没有火焰的训练器
  3. 所属分类:机器学习

    • 发布日期:2018-11-30
    • 文件大小:4096
    • 提供者:winterredrain
  1. 基于深度学习的领域情感词典自动构建_——以金融领域为例.pdf

  2. 基于深度学习的领域情感词典自动构建_——以金融领域为例。 摘要:【目的】为特定领域情感分析任务构建一个适用的情感词典。 【方法】以金融领域为例, 结合语料库和知 识库的特点, 提出一种全新的构建情感词典的方法: 利用词向量方法将文本信息映射到向量空间, 借助已有的 通用情感词典, 自动标引训练语料, 按照9:1的比例构建训练集和预测集。使用Python构建深度神经网络分类器, 判断特定领域候选情感词的情感极性, 构成情感词典。【结果】本文构建的神经网络分类器的训练集准确度为 95.02%, 预
  3. 所属分类:金融

    • 发布日期:2019-10-02
    • 文件大小:608256
    • 提供者:june_hjx
  1. 独立成分分析在瓦斯浓度预测中的应用研究

  2. 为提高含噪声瓦斯浓度数据的预测精度,提出了一种基于独立成分分析(ICA)和k-最近邻(kNN)法的反向传播人工神经网络(BP-ANN)预测模型。利用滑动时间窗算法产生训练样本矩阵,采用ICA方法估计训练样本矩阵中的独立成分,用不含噪声的独立成分重新构建训练集;运用k-NN法减小训练集规模,引入混合距离测度函数降低训练过程的计算复杂度。实验结果表明,该预测模型较普通BP-ANN模型有效减小了瓦斯浓度预测误差和训练时间。
  3. 所属分类:其它

    • 发布日期:2020-05-11
    • 文件大小:242688
    • 提供者:weixin_38724611
  1. 基于视觉信息和深度学习的中文唇语数据集构建与识别_胡扬.caj

  2. 本文以中文唇语识别为主线,通过更有效的数据收集手段将中文的唇语识别问 题拓展到更一般更现实的中文环境中,并通过深度学习技术有效解决现实环境下变 长唇语序列图片的中文识别问题。本文的主要研究内容包括: 1. 研究以互联网视频为数据源头,自动快速构建中文唇语数据集的方法。互联 网视频中的场景变化较多,与现实环境相符,同时资源获取成本较低,本文 基于此,提出有效的从互联网视频中获取可以用于训练唇读模型的唇部序列 图片和对应的中文内容。 2. 研究中文唇语识别的网络设计。相较于限定实验环境下的唇
  3. 所属分类:深度学习

    • 发布日期:2020-04-27
    • 文件大小:1048576
    • 提供者:zhr_the_great
  1. LCQMC数据集.tar.gz

  2. LCQMC 是哈尔滨工业大学在自然语言处理国际顶会 COLING2018 构建的问题语义匹配数据集,其目标是判断两个问题的语义是否相同。构建的方式是先针对不同的领域从百度问答中抽取高频的相关问题,然后通过Wasserstein distance进行初步筛选,最后人工进行标注。数据集一共有260068对标注结果,分为三部分,238766训练集、8802验证集和12500测试集。
  3. 所属分类:深度学习

    • 发布日期:2020-04-24
    • 文件大小:6291456
    • 提供者:tcd1112
  1. 语义相似度任务数据训练集、验证集、测试集。LCQMC

  2. 语义相似度任务数据训练集、验证集、测试集。LCQMC 是哈尔滨工业大学在自然语言处理国际顶会 COLING2018 构建的问题语义匹配数据集,用于判断两个问题的语义是否相同。
  3. 所属分类:互联网

    • 发布日期:2020-04-21
    • 文件大小:6291456
    • 提供者:pengpengchaoren
  1. 化合物肝毒性预测模型的构建及应用研究

  2. 化合物肝毒性预测模型的构建及应用研究,陈潜,范骁辉,目的:建立一种快速且低成本的化合物肝毒性计算预测方法。方法:根据文献收集整理50个肝毒化合物和63个无肝毒化合物组成训练集,�
  3. 所属分类:其它

    • 发布日期:2020-02-23
    • 文件大小:390144
    • 提供者:weixin_38625048
  1. PyTorch 模型训练实用教程

  2. 本教程内容主要为在 PyTorch 中训练一个模型所可能涉及到的方法及函 数, 并且对 PyTorch 提供的数据增强方法(22 个)、权值初始化方法(10 个)、损失函数(17 个)、优化器(6 个)及 tensorboardX 的方法(13 个) 进行了详细介绍,本教程分为四章, 结构与机器学习三大部分一致。 第一章, 介绍数据的划分,预处理,数据增强; 第二章, 介绍模型的定义,权值初始化,模型 Finetune; 第三章, 介绍各种损失函数及优化器; 第四章, 介绍可视化工具,用于监控数
  3. 所属分类:机器学习

    • 发布日期:2019-03-03
    • 文件大小:4194304
    • 提供者:qq_29893385
  1. keras自定义回调函数查看训练的loss和accuracy方式

  2. 前言: keras是一个十分便捷的开发框架,为了更好的追踪网络训练过程中的损失函数loss和准确率accuracy,我们有几种处理方式,第一种是直接通过 history=model.fit(),来返回一个history对象,通过这个对象可以访问到训练过程训练集的loss和accuracy以及验证集的loss和accuracy。 第二种方式就是通过自定义一个回调函数Call backs,来实现这一功能,本文主要讲解第二种方式。 一、如何构建回调函数Callbacks 本文所针对的例子是卷积神经网络
  3. 所属分类:其它

    • 发布日期:2020-12-17
    • 文件大小:83968
    • 提供者:weixin_38557095
  1. TensorFlow2.X使用图片制作简单的数据集训练模型

  2. Tensorflow内置了许多数据集,但是实际自己应用的时候还是需要使用自己的数据集,这里TensorFlow 官网也给介绍文档,官方文档。这里对整个流程做一个总结(以手势识别的数据集为例)。 1、 收集手势图片 数据集下载 方法多种多样了。我通过摄像头自己采集了一些手势图片。保存成如下形式, 以同样的形式在建立一个测试集,当然也可以不弄,在程序里处理。 2、构建数据集 导入相关的包 import tensorflow as tf from tensorflow import keras f
  3. 所属分类:其它

    • 发布日期:2020-12-20
    • 文件大小:154624
    • 提供者:weixin_38668335
  1. ml-project:使用movielens数据集推荐电影-源码

  2. data/提供了一个存储项目原始数据和处理数据的地方。您还可以包含描述项目数据的data/README.md文件。 docker/是为项目指定一个或多个Dockerfile的地方。 Docker(和其他容器解决方案)有助于确保多台机器和部署之间的行为一致。 api/app.py通过REST客户端公开模型以进行预测。您可能会选择从加载(训练后的)模型,而不是直接从库中导入。 models/定义了该任务的机器学习模型的集合,这些模型由base.py定义的通用API统一。这些模型包括用于任何必要
  3. 所属分类:其它

    • 发布日期:2021-03-18
    • 文件大小:3072
    • 提供者:weixin_42120405
  1. 贝叶斯模型构建分类器的设计与实现

  2. 于半月前,针对文本分类进行学习,实验的目的是通过对下图1中的不同情感文本构建训练集模型,对应的下图2是对训练集的注释说明。类标0开头为喜悦类别,类标1开头的为愤怒类别,类别2开头的是厌恶类别,类别3开头的为低落类别。4个训练集文本,分别对应4个分类。如何通过训练集构造分类器,并对测试数据进行验证是本课题的最终目的。其中会涉及贝叶斯公式的理解与实现,文本的预处理(下图1中0_simplifyweibo的训练集是处理过的数据如下图),分词工具的使用,不同贝叶斯模型的构造,试验结果对比。核心思路就两点
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:184320
    • 提供者:weixin_38514805
  1. 旋转森林的一种变体,用于构建整体分类器

  2. 旋转森林是一种有效的整体分类器生成技术,其工作原理是使用主成分分析(PCA)旋转原始特征轴,以便可以形成用于学习基础分类器的不同训练集。 本文介绍了旋转林的一种变体,可以将其视为装袋和旋转林的组合。 在这里,使用装袋将更多的随机性注入到“旋转森林”中,以增加整体成员之间的灵活性。 使用UCI储存库中的33个基准分类数据集进行的实验(其中采用分类树作为基础学习算法)表明,该方法产生的整体分类器的错误率低于Bagging,AdaBoost和Rotation Forest。 误差性能的偏差-方差分析表
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:922624
    • 提供者:weixin_38686557
  1. spam-filter-with-naive-bayes:使用多名词朴素贝叶斯算法构建垃圾邮件SMS过滤器-源码

  2. 天真贝叶斯垃圾邮件过滤器 使用多名词朴素贝叶斯算法构建垃圾邮件SMS过滤器 链接到Jupyter Notebook: 该项目致力于使用已经被人类分类的5,572条SMS消息的数据集来构建垃圾邮件过滤器。 数据集的80%被用作训练集,而20%被用作测试集。 “过滤器”实现了98.7%的分类精度。
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:214016
    • 提供者:weixin_42125826
  1. mlflow-example:此存储库提供了一个示例示例,该示例使用MLflow跟踪,项目和模型模块在容器化环境中进行数据集预处理,GBRT(梯度增强回归树)模型训练和评估,模型调整以及最终模型服务(REST API)-源码

  2. MLflow示例项目+笔记本 该存储库提供了使用MLflow跟踪,项目和模型模块在容器化环境中进行数据集预处理,模型训练和评估,模型调整以及最终模型服务(REST API)的示例。 该项目包含一个MLflow项目,该项目在UC Irvine的上训练GBRT(梯度增强的回归树)模型,并使用Docker映像捕获运行训练和推理代码所需的依赖项。 对话: : 演讲幻灯片: 笔记本: 该项目的结构 指定运行项目的Docker容器环境,并在entry_points定义command和parame
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:4194304
    • 提供者:weixin_42129300
  1. 贝叶斯模型构建分类器的设计与实现

  2. 于半月前,针对文本分类进行学习,实验的目的是通过对下图1中的不同情感文本构建训练集模型,对应的下图2是对训练集的注释说明。类标0开头为喜悦类别,类标1开头的为愤怒类别,类别2开头的是厌恶类别,类别3开头的为低落类别。4个训练集文本,分别对应4个分类。如何通过训练集构造分类器,并对测试数据进行验证是本课题的最终目的。其中会涉及贝叶斯公式的理解与实现,文本的预处理(下图1中0_simplifyweibo的训练集是处理过的数据如下图),分词工具的使用,不同贝叶斯模型的构造,试验结果对比。核心思路就两点
  3. 所属分类:其它

    • 发布日期:2021-01-27
    • 文件大小:184320
    • 提供者:weixin_38589150
  1. Tensorflow2.0:加载与识别经典数据集MINIST

  2. 一 实现思路 1. 加载 MNIST 数据集,得到训练集与测试集 2. 将训练集与测试集转换为DataSet对象 3. 将数据顺序打散 避免每次读取数据顺序相同,使得模型记住训练集的一些特点,降低模型泛化能力。 4. 设置批训练 从训练集总数中随机抽取batchsize个样本,来进行模型训练,相比于使用所用样本构建模型,批训练花费的时间更少,计算效率更高。每训练一个次,就叫一个step,当经历若干个step使得把训练集所有样本训练过以后,那叫一个epoch 5. 数据预处理 图片像素值进行标准化
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:73728
    • 提供者:weixin_38746818
« 12 3 4 5 6 7 8 9 10 ... 25 »