Acerca de este Curso

35,546 vistas recientes
Certificado para compartir
Obtén un certificado al finalizar
100 % en línea
Comienza de inmediato y aprende a tu propio ritmo.
Fechas límite flexibles
Restablece las fechas límite en función de tus horarios.
Nivel intermedio

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Aprox. 23 horas para completar
Inglés (English)

Habilidades que obtendrás

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems
Certificado para compartir
Obtén un certificado al finalizar
100 % en línea
Comienza de inmediato y aprende a tu propio ritmo.
Fechas límite flexibles
Restablece las fechas límite en función de tus horarios.
Nivel intermedio

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

Aprox. 23 horas para completar
Inglés (English)

ofrecido por

Placeholder

Universidad de Alberta

Placeholder

Alberta Machine Intelligence Institute

Programa - Qué aprenderás en este curso

Semana
1

Semana 1

1 hora para completar

Welcome to the Final Capstone Course!

1 hora para completar
2 videos (Total 10 minutos), 2 lecturas
2 videos
Meet your instructors!8m
2 lecturas
Reinforcement Learning Textbook10m
Pre-requisites and Learning Objectives10m
Semana
2

Semana 2

1 hora para completar

Milestone 1: Formalize Word Problem as MDP

1 hora para completar
4 videos (Total 23 minutos)
4 videos
Andy Barto on What are Eligibility Traces and Why are they so named?9m
Let's Review: Markov Decision Processes6m
Let's Review: Examples of Episodic and Continuing Tasks3m
Semana
3

Semana 3

1 hora para completar

Milestone 2: Choosing The Right Algorithm

1 hora para completar
7 videos (Total 40 minutos)
7 videos
Let's Review: Expected Sarsa3m
Let's Review: What is Q-learning?3m
Let's Review: Average Reward- A New Way of Formulating Control Problems10m
Let's Review: Actor-Critic Algorithm5m
Csaba Szepesvari on Problem Landscape8m
Andy and Rich: Advice for Students5m
1 ejercicio de práctica
Choosing the Right Algorithm
Semana
4

Semana 4

1 hora para completar

Milestone 3: Identify Key Performance Parameters

1 hora para completar
4 videos (Total 25 minutos)
4 videos
Let's Review: Non-linear Approximation with Neural Networks4m
Drew Bagnell on System ID + Optimal Control6m
Susan Murphy on RL in Mobile Health7m
1 ejercicio de práctica
Impact of Parameter Choices in RL40m

Reseñas

Principales reseñas sobre A COMPLETE REINFORCEMENT LEARNING SYSTEM (CAPSTONE)

Ver todas las reseñas

Acerca de Programa especializado: Aprendizaje por refuerzo

Aprendizaje por refuerzo

Preguntas Frecuentes

¿Tienes más preguntas? Visita el Centro de Ayuda al Alumno.