论文
随笔
Tags
Slides
⤴

2015

March 4, 2026

Trust Region Policy Optimization

PPO 的前身

Note
Reinforcement Learning
Theoretical
Seminal
ICML
2015

March 27, 2025

Deep Knowledge Tracing

DKT, 知识追踪

Note
Knowledge Tracing
RNN
LSTM
Seminal
Empirical
NeurIPS
2015

MTandHJ © 2026