Acerca de este Curso

83,838 vistas recientes
Certificado para compartir
Obtén un certificado al finalizar
100 % en línea
Comienza de inmediato y aprende a tu propio ritmo.
Fechas límite flexibles
Restablece las fechas límite en función de tus horarios.
Nivel intermedio

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode

Aprox. 22 horas para completar
Inglés (English)

Habilidades que obtendrás

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems
Certificado para compartir
Obtén un certificado al finalizar
100 % en línea
Comienza de inmediato y aprende a tu propio ritmo.
Fechas límite flexibles
Restablece las fechas límite en función de tus horarios.
Nivel intermedio

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode

Aprox. 22 horas para completar
Inglés (English)

ofrecido por

Placeholder

Universidad de Alberta

Placeholder

Alberta Machine Intelligence Institute

Programa - Qué aprenderás en este curso

Calificación del contenidoThumbs Up92%(2,824 calificaciones)Info
Semana
1

Semana 1

1 hora para completar

Welcome to the Course!

1 hora para completar
2 videos (Total 10 minutos), 2 lecturas
2 videos
Meet your instructors!8m
2 lecturas
Reinforcement Learning Textbook10m
Read Me: Pre-requisites and Learning Objectives10m
3 horas para completar

Monte Carlo Methods for Prediction & Control

3 horas para completar
11 videos (Total 58 minutos), 3 lecturas, 2 cuestionarios
11 videos
Using Monte Carlo for Prediction6m
Using Monte Carlo for Action Values2m
Using Monte Carlo methods for generalized policy iteration2m
Solving the Blackjack Example3m
Epsilon-soft policies5m
Why does off-policy learning matter?4m
Importance Sampling4m
Off-Policy Monte Carlo Prediction5m
Emma Brunskill: Batch Reinforcement Learning12m
Week 1 Summary3m
3 lecturas
Module 1 Learning Objectives10m
Weekly Reading40m
Chapter Summary40m
1 ejercicio de práctica
Graded Quiz30m
Semana
2

Semana 2

5 horas para completar

Temporal Difference Learning Methods for Prediction

5 horas para completar
6 videos (Total 37 minutos), 2 lecturas, 2 cuestionarios
6 videos
Rich Sutton: The Importance of TD Learning6m
The advantages of temporal difference learning5m
Comparing TD and Monte Carlo5m
Andy Barto and Rich Sutton: More on the History of RL12m
Week 2 Summary2m
2 lecturas
Module 2 Learning Objectives10m
Weekly Reading40m
1 ejercicio de práctica
Practice Quiz30m
Semana
3

Semana 3

6 horas para completar

Temporal Difference Learning Methods for Control

6 horas para completar
9 videos (Total 30 minutos), 3 lecturas, 2 cuestionarios
9 videos
Sarsa in the Windy Grid World3m
What is Q-learning?3m
Q-learning in the Windy Grid World3m
How is Q-learning off-policy?4m
Expected Sarsa3m
Expected Sarsa in the Cliff World3m
Generality of Expected Sarsa1m
Week 3 Summary2m
3 lecturas
Module 3 Learning Objectives10m
Weekly Reading40m
Chapter summary40m
1 ejercicio de práctica
Practice Quiz30m
Semana
4

Semana 4

7 horas para completar

Planning, Learning & Acting

7 horas para completar
11 videos (Total 47 minutos), 4 lecturas, 2 cuestionarios
11 videos
Comparing Sample and Distribution Models2m
Random Tabular Q-planning3m
The Dyna Architecture5m
The Dyna Algorithm5m
Dyna & Q-learning in a Simple Maze5m
What if the model is inaccurate?3m
In-depth with changing environments5m
Drew Bagnell: self-driving, robotics, and Model Based RL7m
Week 4 Summary1m
Congratulations!2m
4 lecturas
Module 4 Learning Objectives10m
Weekly Reading40m
Chapter Summary40m
Text Book Part 1 Summary40m
1 ejercicio de práctica
Practice Assessment45m

Reseñas

Principales reseñas sobre SAMPLE-BASED LEARNING METHODS

Ver todas las reseñas

Acerca de Programa especializado: Aprendizaje por refuerzo

Aprendizaje por refuerzo

Preguntas Frecuentes

¿Tienes más preguntas? Visita el Centro de Ayuda al Alumno.