什么是策略梯度 Policy Gradients-深度学习(周莫烦)-Python学习网教程

什么是策略梯度 Policy...

下一节课程：什么是 Actor Critic(9588次播放)

5 秒后自动播放下一节

深度学习(周莫烦)

难度:高级共34节317558次学习

第1章机器学习: 什么是机器学习; 人工神经网络 VS 生物神经网络; 什么是神经网络 (机器学习); 神经网络的黑盒不黑 (深度理解神经网络); 梯度下降
第2章神经网络: 什么是卷积神经网络 CNN; 什么是循环神经网络 RNN (深度学习); 什么是 LSTM RNN 循环神经网络; 什么是自编码 Autoencoder; 什么是 GAN 生成对抗网络; 站在巨人的肩膀上, 迁移学习; 什么是激励函数 (深度学习)
第3章深度学习、特征标准化、强化学习: 怎样检验神经网络 (深度学习); 为什么要特征标准化 (深度学习); 怎样区分好用的特征 (深度学习); 什么是过拟合; 优化器 Optimizer 加速神经网络训练; 处理不均衡数据; 什么是 Batch Normalization 批...; 什么是 L1 L2 正规化正则化 Regular...; 什么是强化学习; 强化学习方法汇总 (Reinforcement L...; 什么是 Q Learning; 什么是 Sarsa; 什么是 Sarsa(lambda)
第4章 DQN、Actor Critic、算法: 什么是 DQN; 什么是策略梯度 Policy Gradients; 什么是 Actor Critic; 什么是 Deep Deterministic Po...; 什么是 A3C (Asynchronous Adv...; AlphaGo Zero 为什么更厉害; 什么是遗传算法; 什么是进化策略 What is Evolution...; 什么是神经网络进化

暂无课件

取消回复发送

取消发布笔记发送

© 2021 Python学习网苏ICP备16018502号-40

Python学习网