Acerca de este Curso

98.122 vistas recientes
Fechas límite flexibles
Restablece las fechas límite en función de tus horarios.
Certificado para compartir
Obtén un certificado al finalizar
100 % en línea
Comienza de inmediato y aprende a tu propio ritmo.
Nivel intermedio

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Aprox. 15 horas para completar
Inglés (English)

Qué aprenderás

  • Formalize problems as Markov Decision Processes

  • Understand basic exploration methods and the exploration / exploitation tradeoff

  • Understand value functions, as a general-purpose tool for optimal decision-making

  • Know how to implement dynamic programming as an efficient solution approach to an industrial control problem

Habilidades que obtendrás

  • Artificial Intelligence (AI)
  • Machine Learning
  • Reinforcement Learning
  • Function Approximation
  • Intelligent Systems
Fechas límite flexibles
Restablece las fechas límite en función de tus horarios.
Certificado para compartir
Obtén un certificado al finalizar
100 % en línea
Comienza de inmediato y aprende a tu propio ritmo.
Nivel intermedio

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Aprox. 15 horas para completar
Inglés (English)

ofrecido por

Placeholder

Universidad de Alberta

Placeholder

Alberta Machine Intelligence Institute

Programa - Qué aprenderás en este curso

Calificación del contenidoThumbs Up93%(15,180 calificaciones)Info
Semana
1

Semana 1

1 hora para completar

Welcome to the Course!

1 hora para completar
4 videos (Total 20 minutos), 2 lecturas
4 horas para completar

An Introduction to Sequential Decision-Making

4 horas para completar
8 videos (Total 46 minutos), 3 lecturas, 2 cuestionarios
Semana
2

Semana 2

3 horas para completar

Markov Decision Processes

3 horas para completar
7 videos (Total 36 minutos), 2 lecturas, 2 cuestionarios
Semana
3

Semana 3

3 horas para completar

Value Functions & Bellman Equations

3 horas para completar
9 videos (Total 56 minutos), 3 lecturas, 2 cuestionarios
Semana
4

Semana 4

4 horas para completar

Dynamic Programming

4 horas para completar
10 videos (Total 72 minutos), 3 lecturas, 2 cuestionarios

Reseñas

Principales reseñas sobre FUNDAMENTALS OF REINFORCEMENT LEARNING

Ver todas las reseñas

Acerca de Programa especializado: Aprendizaje por refuerzo

Aprendizaje por refuerzo

Preguntas Frecuentes

¿Tienes más preguntas? Visita el Centro de Ayuda al Alumno.