No Title

$\framebox{ \vbox{ \hbox to 6.28in { {\bf Computational Learning Theory \hf... ...: Prof. Yishay Mansour \hfill Scribe: Harrusi Shachar, Sozio Andrei, } } } }$

Evaluating One Policy With Another
- Importance Sampling
- Policy Sampling
  - Problem of sampling
  - conclusion:
Q-learning and SARSA algorithms
- Q-learning
  - remarks:
- SARSA
Convergence proof
About this document ...

Yishay Mansour
2000-01-07