[MUSIC] A continuación revisaremos algunas funciones para hacer gráficas de alto nivel, es decir gráficas preestablecidas que nos dicen cierta información sobre los datos que estamos observando. Algunas que veremos serán gráficas de puntos, histogramas, densidades, barras o de caja. Hoy en las primeras funciones de alto nivel que veremos es las gráficas de histogramas. Podemos crear histogramas utilizando la función hist, esta recibe un vector de valores numéricos y lo que hace es nos grafica el histograma tal como lo haríamos punto por punto. En caso de que no querramos que nos grafique frecuencias, lo que podemos utilizar es el parámetro freq = false para que nos grafique probabilidades en vez de frecuencias. Podemos cambiar el color de las barras de nuestro histograma utilizando un parámetro que you utilizamos antes, col donde le pasamos como cadena el nombre del color que queremos utilizar, en este caso estamos usando red, es decir rojo. Cuando lo utilizamos así nos grafica el histograma de color rojo. También es posible cambiar el número de cajas que queremos utilizar en nuestro histograma. Para eso utilizamos la función breaks, podemos observar que dependiendo de las cajas que utilicemos el gráfico podría ser de una forma u otra. Como el histograma no nos puede dar una visión mas o menos exacta de cómo se están comportando nuestros datos, podemos utilizar un truco para graficar una densidad encima del histograma y esto lo hacemos de la siguiente manera. En este código estamos utilizando el procedimiento por fases del que you hemos hablado. Primero pintamos un histograma y encima de él luego pintamos por medio de líneas los puntos que nos regresa la función de NOR que esta función nos regresa los valores de la densidad de los datos que estamos observando. Esta línea la podemos pintar de color azul para que sea distinguida. Una manera más efectiva de ver la densidad de unos datos es utilizando una gráfica de densidad por kernel. Para esto tenemos que utilizar la función density. A la función density lo único que tenemos que ponerle como parámetro de entrada es un vector numérico, como you lo hemos hecho antes. Una vez que introducimos ese vector numérico y mandamos a llamar a la función, esta nos regresará un ajuste a un kernel de manera no paramétrica. Este regreso de la función density puede ser utilizada, entonces, por la función plot para graficar justamente ese kernel. Un kernel no es más que una función que nos va describiendo la distribución de nuestros datos de manera no paramétrica. Por eso cuando mandamos a llamar a plot con la densidad de la función densidad, lo que observamos es que la gráfica puede tener ciertas curvas, no es totalmente suave. Las gráficas de puntos lo que nos grafican es un nombre y el valor que va teniendo, entonces lo único que necesita recibir son un vector de nombres y un vector de valores para cada uno de esos nombres. En este ejemplo vamos a utilizar el dataset conocido como mtcars. Y una columna de éste, que es mpg que nos dice el rendimiento por galón de gasolina en millas de los diferentes modelos de autos. Si mandamos a llamar esa columna y además los nombres de los coches, podemos utilizar la función Dotchart para generar una gráfica de puntos. Mandamos a llamar a dotchart primero con un argumento de un vector numérico con los valores de mpg y como segundo argumento las etiquetas para cada uno de esos valores numéricos. Finalmente veremos la función Boxplots que lo que hace es generarnos una gráfica de caja. Este tipo de gráficas lo que hace es, nos dice cómo se están comportando nuestros datos, unos respecto a otros. Boxplot recibe como parámetros un dataset o un dataframe. En este caso utilizaremos de nuevo mtcars, como las columnas de este dataset están nombradas, podemos utilizarlas en la fórmula que vamos a poner también como parámetro de entrada. En el caso que estamos observando, podemos ver que estamos tratando de explicar la columna mpg por el número de cilindros o llamada cyl. Entonces el boxplot que nos generará será por cada número de cilindro, los valores de dispersión de las millas por hora, dependiendo también de todos los modelos que estamos observando con ese número de cilindros. También como lo hemos hecho con otras funciones de alto nivel, podemos pasarle parámetros la función boxplot para cambiar títulos y etiquetas de los ejes. [MUSIC]