Introduction
论文总结与算法学习
基础概念汇总
1-线性代数/矩阵论
2-概率论
4-随机过程
5-机器学习
6-线性规划
7-整数规划
8-凸优化(0)
8-拉格朗日对偶理论
CS
0 CS-排序算法
0 CS-TOP-K 问题
3 Python 经典问题
ML
0 ML-经典面试题
0 ML-评估指标
0 ML-激活函数
1 百面 ML-3 经典算法
1 百面 ML-3 降维/非监督学习
1 百面 ML-3CNN/RNN
1 百面 ML-3 优化算法
1 百面 ML-集成学习
2 李宏毅 ML-Optimization
10.1 遗传算法-基本原理
10.2 遗传算法-自适应策略
10.3 遗传算法-精英保留
RL 算法
1 经典-DQN
1 经典-double dqn
1 经典-dueling dqn
1 经典-Prioritized experience
1 经典-A3C
2 HRL-HIRO
2 HRL-FuN
3 知识蒸馏简介
3 知识蒸馏
3 策略蒸馏
3 Distilling Policy Distillation
3 Oracle Policy Distillation
10 深度神经进化
10 遗传模糊树
RL 基础
0 面试-简历相关
0 面试-RL 相关
0 面试-DL 相关
1 RLBook-start
1 RLBook-表格型方法
1 RLBook-函数近似
1 RLBook-应用案例
2 spinup-PG
2 spinup-VPG
2 spinup-TRPO
2 spinup-PPO
2 spinup-DDPG
2 spinup-TD3
2 spinup-SAC
4 周博磊 RL-1-概述
4 周博磊 RL-2-MDP
4 周博磊 RL-3-model_free
4 周博磊 RL-4-值函数逼近
4 周博磊 RL-56-策略优化
4 周博磊 RL-7-model_based
4 周博磊 RL-8-IRL
4 周博磊 RL-9-分布式
4 周博磊 RL-10-总结
4 周博磊 RL-11-番外-AlphaStar
MARL
1.1 协作 MARL:QMIX
1.2 协作 MARL:QTRAN
1.3 协作 MARL:Qatten
1.4 协作 MARL:MAVEN
2.1 沟通 MARL:近似可分解函数
Recommend
1 传统算法-FM
1 传统算法-CF
SC2
1 环境安装
论文翻译
RL
0. 强化学习-GAE
0. 强化学习-DPG
0. 强化学习-DDPG
0. 强化学习-PPO
2. 分层强化学习-MAXQ
3. 游戏 AI-AlphaGoMaster
3. 游戏 AI-AlphaGoZero
3. 游戏 AI-AlphaZero
3. 游戏 AI-MuZero
3. 游戏 AI-绝悟 1-AAAI
3. 游戏 AI-绝悟 2-NIPS
3. 游戏 AI-绝悟 3-TNNLS
3. 游戏 AI-绝悟 4-英雄选择
3. 游戏 AI-星际-AlphaStar1
3. 游戏 AI-斗地主-DouZero
3. 游戏 AI-斗地主-DeltaDou
3. 游戏 AI-斗地主-CQL
4. 探索-自博弈-课程学习
10. 深度神经进化
10. 进化策略
MARL
0. 遗传模糊树
0. 遗传模糊树训练
1. 值分解-IQL
1. 值分解-VDN
1. 值分解-QMIX
1. 值分解-QTRAN
1. 值分解-Qatten
1. 混合-MADDPG
1. 混合-COMA
2. 交流-commNet
2. 交流-IC3Net
2. 交流-BicNet
2. 交流-RIAL_DIAL
2. 交流-GatedMLAC
2. 交流-SchedNet
2. 交流-MAAC
2. 交流-tarMAC
2. 交流-ATOC
2. 基于交流最小化的近似可分解价值函数
2. 交流-I2C
3. 探索-MAVEN
Meta MARL
1. LIIR
1. learning to reinforcement learn
1. RL2
Inverse RL
1. IRL-GAIL
2. IMARL-OvercookedGame
打车
0. 综述
1. ETA-HetETA
2. 派单-滴滴 KDD17
2. 派单-滴滴 KDD18
2. 派单-滴滴 KDD19
2. 派单-DRL-with-knowledge-transger
推荐系统
0. 综述-图学习
0. 综述-DL
名词总结
总述
ML
DL
RL
MARL
Meta-RL
Questions
Sequences
竞赛
智能博弈挑战赛
Questions
问题整理
git
上传大文件出错
! [rejected]master -> master (non-fast-forward)
ubuntu
ssr 环境搭建
ubuntu 自动更新导致 nvidia 驱动不能用
ubuntu 删除系统内核
Windows
Windows 安装 mujoco
Windows 安装 gym box2d 不能用
Python
ModuleNotFoundError: No module named 'pip._internal'
Published with GitBook
1. RL2
1.3 RL2
1.3 RL2
paper:
Fast Reinforcement Learning via Slow Reinforcement Learning
results matching "
"
No results matching "
"