什么是 策略梯度 Policy...
登陆
下一节课程: 什么是 Actor Critic
(8058次播放)
5
秒后自动播放下一节
下一节
重新观看
介绍 >
深度学习(周莫烦)
难度:高级
共34节
269645次学习
章节
评论
笔记
课件
第1章 机器学习
什么是机器学习
人工神经网络 VS 生物神经网络
什么是神经网络 (机器学习)
神经网络的黑盒不黑 (深度理解神经网络)
梯度下降
第2章 神经网络
什么是卷积神经网络 CNN
什么是循环神经网络 RNN (深度学习)
什么是 LSTM RNN 循环神经网络
什么是自编码 Autoencoder
什么是 GAN 生成对抗网络
站在巨人的肩膀上, 迁移学习
什么是激励函数 (深度学习)
第3章 深度学习、特征标准化、强化学习
怎样检验神经网络 (深度学习)
为什么要特征标准化 (深度学习)
怎样区分好用的特征 (深度学习)
什么是过拟合
优化器 Optimizer 加速神经网络训练
处理不均衡数据
什么是 Batch Normalization 批...
什么是 L1 L2 正规化 正则化 Regular...
什么是强化学习
强化学习方法汇总 (Reinforcement L...
什么是 Q Learning
什么是 Sarsa
什么是 Sarsa(lambda)
第4章 DQN、Actor Critic、算法
什么是 DQN
什么是 策略梯度 Policy Gradients
什么是 Actor Critic
什么是 Deep Deterministic Po...
什么是 A3C (Asynchronous Adv...
AlphaGo Zero 为什么更厉害
什么是遗传算法
什么是进化策略 What is Evolution...
什么是神经网络进化
全部评论
我要评论
暂无评论~
暂无课件
全部笔记
发布笔记
暂无笔记~
取消
回复
发送
发布
取消
发布笔记
发送
发布
© 2021 Python学习网
苏ICP备2021003149号-1
Python学习网
首页
视频
手册
图文
文章
社区