Acerca de este Curso

135,703 vistas recientes

Resultados profesionales del estudiante

14%

comenzó una nueva carrera después de completar estos cursos
Certificado para compartir
Obtén un certificado al finalizar
100 % en línea
Comienza de inmediato y aprende a tu propio ritmo.
Fechas límite flexibles
Restablece las fechas límite en función de tus horarios.
Nivel intermedio

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Aprox. 15 horas para completar
Inglés (English)

Qué aprenderás

  • Formalize problems as Markov Decision Processes

  • Understand basic exploration methods and the exploration / exploitation tradeoff

  • Understand value functions, as a general-purpose tool for optimal decision-making

  • Know how to implement dynamic programming as an efficient solution approach to an industrial control problem

Habilidades que obtendrás

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems

Resultados profesionales del estudiante

14%

comenzó una nueva carrera después de completar estos cursos
Certificado para compartir
Obtén un certificado al finalizar
100 % en línea
Comienza de inmediato y aprende a tu propio ritmo.
Fechas límite flexibles
Restablece las fechas límite en función de tus horarios.
Nivel intermedio

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Aprox. 15 horas para completar
Inglés (English)

ofrecido por

Placeholder

Universidad de Alberta

Placeholder

Alberta Machine Intelligence Institute

Programa - Qué aprenderás en este curso

Calificación del contenidoThumbs Up93%(13,244 calificaciones)Info
Semana
1

Semana 1

1 hora para completar

Welcome to the Course!

1 hora para completar
4 videos (Total 20 minutos), 2 lecturas
4 horas para completar

An Introduction to Sequential Decision-Making

4 horas para completar
8 videos (Total 46 minutos), 3 lecturas, 2 cuestionarios
Semana
2

Semana 2

3 horas para completar

Markov Decision Processes

3 horas para completar
7 videos (Total 36 minutos), 2 lecturas, 2 cuestionarios
Semana
3

Semana 3

3 horas para completar

Value Functions & Bellman Equations

3 horas para completar
9 videos (Total 56 minutos), 3 lecturas, 2 cuestionarios
Semana
4

Semana 4

4 horas para completar

Dynamic Programming

4 horas para completar
10 videos (Total 72 minutos), 3 lecturas, 2 cuestionarios

Reseñas

Principales reseñas sobre FUNDAMENTALS OF REINFORCEMENT LEARNING

Ver todas las reseñas

Acerca de Programa especializado: Aprendizaje por refuerzo

Aprendizaje por refuerzo

Preguntas Frecuentes

¿Tienes más preguntas? Visita el Centro de Ayuda al Alumno.