Chen Kai Blog
  • 首页
  • 归档
  • 分类
  • 标签
  • 首页
  • 归档
  • 分类
  • 标签
 强化学习
2024 [12]
  • 强化学习(十二)—— RLHF 与大语言模型应用 10-04
  • 强化学习(十一)—— 层次化强化学习与元学习 09-27
  • 强化学习(十)—— 离线强化学习 09-20
  • 强化学习(九)—— 多智能体强化学习 09-13
  • 强化学习(八)—— AlphaGo 与蒙特卡洛树搜索 09-06
  • 强化学习(七)—— 模仿学习与逆强化学习 09-06
  • 强化学习(六)—— PPO 与 TRPO:信任域策略优化 09-03
  • 强化学习(五)—— Model-Based 强化学习与世界模型 08-30
  • 强化学习(四)—— 探索策略与好奇心驱动学习 08-23
  • 强化学习(三)—— Policy Gradient 与 Actor-Critic 方法 08-16
  • 强化学习(二)—— Q-Learning 与深度 Q 网络( DQN) 08-09
  • 强化学习(一)—— 基础与核心概念 08-02
© 2020 - 2026  Chen Kai
访问人数