您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 动手深度学习 笔记 6

  2. 梯度消失和梯度爆炸 当神经网络的层数较多时,模型的数值稳定性容易变差。 假设一个层数为 L 的多层感知机的第 l 层 H(l) 的权重参数为 W(l) ,输出层 H(L) 的权重参数为 W(L) 。为了便于讨论,不考虑偏差参数,且设所有隐藏层的激活函数为恒等映射(identity mapping) ϕ(x)=x 。给定输入 X ,多层感知机的第 l 层的输出 H(l)=XW(1)W(2)…W(l) 。此时,如果层数 l 较大, H(l) 的计算可能会出现衰减或爆炸。当层数较多时,梯度的计算也容易
  3. 所属分类:其它

    • 发布日期:2021-01-07
    • 文件大小:96256
    • 提供者:weixin_38737521
  1. 动手学深度学习Pytorch版本学习笔记 Task4

  2. 1.机器翻译及相关技术 机器翻译(MT):将一段文本从一种语言自动翻译为另一种语言,用神经网络解决这个问题通常称为神经机器翻译(NMT)。 主要特征:输出是单词序列而不是单个单词。 输出序列的长度可能与源序列的长度不同。 主要步骤: 1. 数据预处理 2.分词 3.建立词典 Sequence to Sequence模型: 2.注意力机制与Seq2seq模型 a.点注意力机制与多层感知机注意力机制 b.引入注意力机制的Seq2seq模型:将注意机制添加到sequence to sequence
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:199680
    • 提供者:weixin_38717896
  1. 深度学习笔记(1)——感知机

  2. 目录 感知机概念 几种感知机 与门(and_gate) 或门(or_gate) 非与门 (not_and_gate) 感知机叠加 异或门 一、感知机概念 接触深度学习的第一个概念就是感知机,感知机是与门、或门的逻辑电路,是一种判别模型。常见的感知机分为与门、或门、非与门。 通过感知机,相当于是用一条直线将空间进行了划分。 二、几种感知机 1. 与门(and_gate) 我们都知道,与门只有在输入的 x1 和 x2 都是1的情况下才会输出1,即: (0, 0) -> 0 (1, 0) -&g
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:142336
    • 提供者:weixin_38703968
  1. 动手学深度学习学习笔记tf2.0版(3.8: 多层感知机)

  2. 注意这里的bh维度为 1 * h,计算时使用广播机制,进行计算 所以引入激活函数 %matplotlib inline import tensorflow as tf from matplotlib import pyplot as plt import numpy as np import random def use_svg_display(): # 用矢量图显示 %config InlineBackend.figure_format = 'svg' def set_fi
  3. 所属分类:其它

    • 发布日期:2021-01-06
    • 文件大小:446464
    • 提供者:weixin_38647925
  1. 深度学习PyTorch版学习笔记与心得(二)

  2. 多层感知机     1.多层感知机的基本知识       多层感知机(MLP)是研究神经网络的一个非常重要的多层模型。       下图展示了一个多层感知机的神经网络图,它含有一个隐藏层,该层中有5个隐藏单元。 表达公式:       具体来说,给定一个小批量样本X∈Rn×dX∈Rn×d,其批量大小为nn,输入个数为dd。假设多层感知机只有一个隐藏层,其中隐藏单元个数为hh。记隐藏层的输出(也称为隐藏层变量或隐藏变量)为HH,有H∈Rn×hH∈Rn×h。因为隐藏层和输出层均是全连接层,可以设隐
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:84992
    • 提供者:weixin_38572115
  1. 动手学深度学习Pytorch版本学习笔记 Task3

  2. 1.过拟合、欠拟合及其解决方案 过拟合:模型无法得到较低的训练误差,我们将这一现象称作欠拟合(underfitting); 欠拟合:模型的训练误差远小于它在测试数据集上的误差,我们称该现象为过拟合(overfitting)。 在实践中,我们要尽可能同时应对欠拟合和过拟合。 解决过拟合的方法:权重衰减(L2 范数正则化)和丢弃法 2.梯度消失和梯度爆炸 a.梯度消失和梯度爆炸 假设一个层数为LL的多层感知机的第ll层H(l)H(l)的权重参数为W(l)W(l),输出层H(L)H(L)的权重参数为W
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:51200
    • 提供者:weixin_38694800