搜索资源 - 动手学习深度学习—Task04 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 动手学习深度学习—Task04

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

《动手学深度学习》笔记 Task04 机器翻译及相关技术；注意力机制与Seq2seq模型；Transformer
机器翻译和数据集机器翻译（MT）：将一段文本从一种语言自动翻译为另一种语言，用神经网络解决这个问题通常称为神经机器翻译（NMT）。主要特征：输出是单词序列而不是单个单词。输出序列的长度可能与源序列的长度不同。数据预处理将数据集清洗、转化为神经网络的输入minbatch 分词字符串—单词组成的列表建立词典单词组成的列表—单词id组成的列表载入数据集 Encoder-Decoder encoder：输入到隐藏状态 decoder：隐藏状态到输出 Sequence to Sequen
所属分类：其它
- 发布日期：2021-01-07
- 文件大小：315392
- 提供者：weixin_38739837

《动手学深度学习》Task04：机器翻译及相关技术+注意力机制与Seq2seq模型+Transformer
文章目录1 机器翻译及相关技术1.1 机器翻译基本原理1.2 Encoder-Decoder1.3 Sequence to Sequence模型1.4 Beam Search2 注意力机制与Seq2seq模型2.1 注意力机制2.2 注意力机制的计算函数介绍2.3 引入注意力机制的Seq2seq模型3 Transformer3.1 Transformer结构概念3.2 Transformer结构层剖析3.3 Transformer之Encoder+Decoder 1 机器翻译及相关技术 1.1
所属分类：其它
- 发布日期：2021-01-07
- 文件大小：742400
- 提供者：weixin_38667408

动手学深度学习Pytorch版本学习笔记 Task 04
1.机器翻译及相关技术 1.1数据预处理读取数据，处理数据中的编码问题，并将无效的字符串删除分词，分词的目的就是将字符串转换成单词组成的列表。目前有很多现成的分词工具可以直接使用，也可以直接按照空格进行分词(不推荐，因为分词不是很准确) 建立词典，将单词组成的列表编程单词id组成的列表，这里会得到如下几样东西 (1). 去重后词典，及其中单词对应的索引列表。注：去重后排序作用：高频词的id在前，这样可以减少查询次数（相对于随机编码），训练word2vec中有个HUffman树，也是这个思想
所属分类：其它
- 发布日期：2021-01-06
- 文件大小：70656
- 提供者：weixin_38598745

《动手学深度学习》第二次打卡-学习小队
一、学习任务： Task03：过拟合、欠拟合及其解决方案；梯度消失、梯度爆炸；循环神经网络进阶 Task04：机器翻译及相关技术；注意力机制与Seq2seq模型；Transformer Task05：卷积神经网络基础；leNet；卷积神经网络进阶二、学习要点 2.1 过拟合、欠拟合及其解决方案过拟合：太过贴近于训练数据的特征了，在训练集上表现非常优秀，近乎完美的预测/区分了所有的数据，但是在新的测试集上却表现平平欠拟合：样本不够或者算法不精确，测试样本特性没有学到，不具泛化性，拿到新样本后
所属分类：其它
- 发布日期：2021-01-06
- 文件大小：512000
- 提供者：weixin_38613154

动手学深度学习Task04
Task04 1.机器翻译及相关技术机器翻译（MT）：将一段文本从一种语言自动翻译为另一种语言，用神经网络解决这个问题通常称为神经机器翻译（NMT）。主要特征：输出是单词序列而不是单个单词。输出序列的长度可能与源序列的长度不同。 import os os.listdir('/home/kesci/input/') out：[‘fraeng6506’, ‘d2l9528’, ‘d2l6239’] 引入相关包: import sys sys.path.append('/home/kesci/
所属分类：其它
- 发布日期：2021-01-06
- 文件大小：316416
- 提供者：weixin_38724919

《动手学深度学习》Task04 ：机器翻译及相关技术；注意力机制与Seq2seq模型；Transformer
Task04 ：机器翻译及相关技术；注意力机制与Seq2seq模型；Transformer 1.机器翻译及相关技术机器翻译和数据集机器翻译（MT）：将一段文本从一种语言自动翻译为另一种语言，用神经网络解决这个问题通常称为神经机器翻译（NMT）。主要特征：输出是单词序列而不是单个单词。输出序列的长度可能与源序列的长度不同。步骤： 1.读取数据 2.数据预处理 3.分词：将字符串变成单词组成的列表 4.建立词典：将单词组成的列表变成单词id组成的列表 5.Encoder-Decoder：
所属分类：其它
- 发布日期：2021-01-06
- 文件大小：1048576
- 提供者：weixin_38501045

动手学深度学习Pytorch版Task04
机器翻译及相关技术机器翻译和数据集机器翻译（MT）：将一段文本从一种语言自动翻译为另一种语言，用神经网络解决这个问题通常称为神经机器翻译（NMT）。主要特征：输出是单词序列而不是单个单词。输出序列的长度可能与源序列的长度不同。需要调用的包： import sys sys.path.append('/home/kesci/input/d2l9528/') import collections import d2l import zipfile from d2l.data.base imp
所属分类：其它
- 发布日期：2021-01-06
- 文件大小：242688
- 提供者：weixin_38738830

伯禹《动手学深度学习》打卡博客：Task03+Task04
量太大了，我先挑几个我感兴趣的学一下，漏下的等有空再补上了文章目录一、循环神经网络二、GRU（gated recurrent unit）三、LSTM（长短期记忆）一、循环神经网络参考博客：零基础入门深度学习(5) – 循环神经网络 1.循环神经网络最大的用处就是处理序列的信息，即前面和后面的输入是有关系的，比如理解一句话的意思，以及处理视频 2.语言模型：给定一句话前面的成分，预测接下来最有可能的一个词是什么 3.下面是一个简单的RNN模型示意图，它由输入层、隐藏层和输出层组成 4.全
所属分类：其它
- 发布日期：2021-01-06
- 文件大小：260096
- 提供者：weixin_38659646

动手学深度学习Pytorch Task04
本节课主要内容为机器翻译及相关技术、注意力机制与Seq2seq模型、Transformer 一、机器翻译及相关技术机器翻译：将一段文本从一种语言自动翻译为另一种语言，用神经网络解决这个问题通常称为神经机器翻译。主要特征：输出是单词序列而不是单个单词。输出序列的长度可能与源序列的长度不同。导入库 import os os.listdir('/home/kesci/input/') import sys sys.path.append('/home/kesci/input/d2l9528/'
所属分类：其它
- 发布日期：2021-01-06
- 文件大小：807936
- 提供者：weixin_38693589

动手学深度学习实现DAY-2
节选自“ElitesAI·动手学深度学习PyTorch版” Task03：过拟合、欠拟合及其解决方案；梯度消失、梯度爆炸；循环神经网络进阶（1天） Task04：机器翻译及相关技术；注意力机制与Seq2seq模型；Transformer（1天） Task05：卷积神经网络基础；leNet；卷积神经网络进阶（1天）过拟合、欠拟合及其解决方案过拟合、欠拟合的概念权重衰减丢弃法模型选择、过拟合和欠拟合训练误差和泛化误差在解释上述现象之前，我们需要区分训练误差（training err
所属分类：其它
- 发布日期：2021-01-06
- 文件大小：1048576
- 提供者：weixin_38586279

【Pytorch】动手学深度学习（二）
学习安排如下： Task03：过拟合、欠拟合及其解决方案；梯度消失、梯度爆炸；循环神经网络进阶（1天） Task04：机器翻译及相关技术；注意力机制与Seq2seq模型；Transformer（1天） Task05：卷积神经网络基础；leNet；卷积神经网络进阶（1天） Task03：过拟合、欠拟合及其解决方案；梯度消失、梯度爆炸；循环神经网络进阶（1天）梯度消失部分，主要是协变量偏移、标签偏移、概念偏移三个概念，第一次接触；循环神经网络以及过拟合部分比较容易理解； Task04：机器翻译及
所属分类：其它
- 发布日期：2021-01-06
- 文件大小：51200
- 提供者：weixin_38717359

动手学习深度学习—Task04
文章目录GRULSTM深度循环神经网络双向循环神经网络 GRU RNN存在的问题：梯度较容易出现衰减或爆炸（BPTT）⻔控循环神经⽹络：捕捉时间序列中时间步距离较⼤的依赖关系 GRU: Rt=σ(XtWxr+Ht−1Whr+br)Zt=σ(XtWzr+Ht−1Whz+bz)H^t=tanh(XtWxh+(Rt⨀Ht−1)Whh+bh)Ht=Zt⨀Ht−1+(1−Zt)⨀H^t R_t = \sigma(X_tW_{xr}+H_{t-1}W_{hr}+b_r)\\ Z_t = \sigma(
所属分类：其它
- 发布日期：2021-01-06
- 文件大小：242688
- 提供者：weixin_38609089

动手学深度学习 Task04 机器翻译及相关技术；注意力机制与Seq2seq模型；Transformer
【一】机器翻译及相关技术机器翻译（MT）：将一段文本从一种语言自动翻译为另一种语言，用神经网络解决这个问题通常称为神经机器翻译（NMT）。主要特征：输出的是单词序列而不是单个单词。输出序列的长度可能与源序列的长度不同。数据预处理将数据集清洗、转化为神经网络的输入minbatch。字符在计算机里是以编码的形式存在，我们通常所用的空格是 \x20 ，是在标准ASCII可见字符 0x20~0x7e 范围内。而 \xa0 属于 latin1 （ISO/IEC_8859-1）中的扩展字符集字
所属分类：其它
- 发布日期：2021-01-20
- 文件大小：424960
- 提供者：weixin_38653040

DAY 2 动手学习深度学习
【任务安排】： Task03：过拟合、欠拟合及其解决方案；梯度消失、梯度爆炸；循环神经网络进阶（1天） Task04：机器翻译及相关技术；注意力机制与Seq2seq模型；Transformer（1天） Task05：卷积神经网络基础；leNet；卷积神经网络进阶（1天） Task03：过拟合、欠拟合及其解决方案过拟合、欠拟合的概念权重衰减丢弃法梯度消失、梯度爆炸梯度消失和梯度爆炸考虑到环境因素的其他问题 Kaggle房价预测循环神经网络进阶深度卷积神经网络（AlexNet）使
所属分类：其它
- 发布日期：2021-01-20
- 文件大小：194560
- 提供者：weixin_38520258

动手学深度学习打卡之二。
第二次打卡内容（2月15日-18日） Task03：过拟合、欠拟合及其解决方案；梯度消失、梯度爆炸；循环神经网络进阶（1天） Task04：机器翻译及相关技术；注意力机制与Seq2seq模型；Transformer（1天） Task05：卷积神经网络基础；leNet；卷积神经网络进阶（1天）感觉内容比较多啦，终于看完了。。下面附上一些学习中查到的资料。 Deep Learning（深度学习）学习笔记整理系列之（一） b站上动手学深度学习开学前要学完哦！！加油！！作者：poppy917
所属分类：其它
- 发布日期：2021-01-20
- 文件大小：28672
- 提供者：weixin_38506835

动手学深度学习（Pytorch版）task3-5打卡
对于task3-5的内容进行打卡 Task03：过拟合、欠拟合及其解决方案；梯度消失、梯度爆炸；循环神经网络进阶模型复杂度和误差之间的关系权重衰减的计算公式： Xavier初始化梯度裁剪循环神经网络中较容易出现梯度衰减或梯度爆炸，这会导致网络几乎无法训练。裁剪梯度（clip gradient）是一种应对梯度爆炸的方法。假设我们把所有模型参数的梯度拼接成一个向量 g ，并设裁剪的阈值是 θ 。裁剪后的梯度为： GRU 重置门用于捕捉时间序列里的短期依赖关系更新门有助于捕捉时间
所属分类：其它
- 发布日期：2021-01-20
- 文件大小：773120
- 提供者：weixin_38735790

《动手学深度学习》Task04 ：卷积神经网络基础；leNet；卷积神经网络进阶
Task04 ：卷积神经网络基础；leNet；卷积神经网络进阶 1.卷积神经网络基础下面是一些卷积神经网络的基本概念：二维互相关运算二维互相关（cross-correlation）运算的输入是一个二维输入数组和一个二维核（kernel）数组，输出也是一个二维数组，其中核数组通常称为卷积核或过滤器（filter）。卷积核的尺寸通常小于输入数组，卷积核在输入数组上滑动，在每个位置上，卷积核与该位置处的输入子数组按元素相乘并求和，得到输出数组中相应位置的元素。图1展示了一个互相关运算的例子，阴影
所属分类：其它
- 发布日期：2021-01-20
- 文件大小：885760
- 提供者：weixin_38567813