[MÚSICA] Hola, bienvenido a la primera ayudantía de nuestro curso de minería de datos. Mi nombre es Carlos Aguirre y actualmente trabajo con el profesor Karim Pichara. Seré el encargado de enseñarles a aplicar los algoritmos vistos a lo largo del curso, y así en el futuro puedan aplicarlos en sus propios proyectos personales. La principal motivación de este video es explicarles de que se tratarán las video ayudantías, qué herramientas utilizaremos y dónde podemos encontrar bases de datos reales, para experimentar o utilizar. Sin más reparos, les mostraré la herramienta que utilizaremos durante el curso. Esta se llama RapidMiner Studio, fue creada en 2001 y es totalmente gratuita hasta una cierta cantidad de datos, 10.000 filas para ser exactos. Si bien existen varias herramientas en la web, esta la escogimos principalmente por tres razones. La primera razón, es por la interfaz de usuario, la cual es súper amigable y fácil de usar, no se requiere de ningún conocimiento previo para empezar a utilizarlo. Segundo, debido a que contiene más de 500 operadores, lo cual lo hace excelente para una gran cantidad de problemas. Por último, es gratis y está disponible para una gran cantidad de sistemas operativos. Si bien RapidMiner será nuestra herramienta para aplicar los algoritmos vistos en clase, Kaggle será la principal plataforma donde sacaremos las bases de datos reales. Para que tengan un poco de historia, Kaggle fue creada en 2010, con la finalidad de que grupos de personas compitieran por conseguir los mejores resultados en un cierto problema. Se han hecho varias competencias you, en donde las empresas reales suben sus bases de datos y lo que les gustaría obtener. Luego, grupos de personas empiezan a crear modelos para resolver estos problemas, y los suben a la plataforma. El grupo que obtenga el mayor resultado se lleva el premio. Además, Kaggle tiene varias ventajas asociadas. La primera es que existen muchos tutoriales, los cuales se encuentran disponibles para descargar junto con los mejores modelos propuestos. También cuenta con más 4.000 bases de datos reales, de cualquier tema que les interese. Por ejemplo, cuenta con el precio de las cryptomonedas, durante los últimos tres años. Por último, como se mencionó anteriormente, tiene estas competencias, lo cual nos permite poder aprender de otros grupos. La otra plataforma que me gustaría mostrarles, enseñarles, es de la Universidad de California, Irvine, la cual cuenta con 349 bases de datos. Si bien este repositorio no es tan extenso como el de Kaggle, es ampliamente usado por la comunidad, tiene buenas descripciones y permite poder filtrar de manera fácil las bases de datos. En este video les quise mostrar las herramientas que utilizaremos a lo largo del curso, junto con las principales plataformas donde extraeremos nuestras bases de datos. Eso ha sido todo por hoy, y espero verlos pronto en la próxima ayudantía, donde usaremos reglas de asociación para obtener los ítems frecuentes de las transacciones de venta de una pastelería. [AUDIO_EN_BLANCO]