Project: Analyze Text Data with Yellowbrick

ofrecido por
In this proyecto guiado, you will:

Use visual diagnostic tools from Yellowbrick to steer your machine learning workflow

Vectorize text data using TF-IDF

Cluster documents using embedding techniques and appropriate metrics

Clock2 hours
CloudNo download needed
VideoSplit-screen video
Comment DotsInglés (English) + subtitles
LaptopNot for mobile

Welcome to this project-based course on Analyzing Text Data with Yellowbrick. Tasks such as assessing document similarity, topic modelling and other text mining endeavors are predicated on the notion of "closeness" or "similarity" between documents. In this course, we define various distance metrics (e.g. Euclidean, Hamming, Cosine, Manhattan, etc) and understand their merits and shortcomings as they relate to document similarity. We will apply these metrics on documents within a specific corpus and visualize our results. By the end of this course, you will be able to confidently use visual diagnostic tools from Yellowbrick to steer your machine learning workflow, vectorize text data using TF-IDF, and cluster documents using embedding techniques and appropriate metrics. This course runs on Coursera's hands-on project platform called Rhyme. On Rhyme, you do projects in a hands-on manner in your browser. You will get instant access to pre-configured cloud desktops containing all of the software and data you need for the project. Everything is already set up directly in your internet browser so you can just focus on learning. For this project, you’ll get instant access to a cloud desktop with Python, Jupyter, Yellowbrick, and scikit-learn pre-installed. Notes: - You will be able to access the cloud desktop 5 times. However, you will be able to access instructions videos as many times as you want. - This course works best for learners who are based in the North America region. We’re currently working on providing the same experience in other regions.

Habilidades que desarrollarás

Data ScienceNatural Language ProcessingMachine LearningPython ProgrammingData Visualization (DataViz)

Learn step-by-step

In a video that plays in a split-screen with your work area, your instructor will walk you through these steps:

  1. Introduction and Loading the Corpus

  2. Vectorizing the Documents

  3. Clustering Similar Documents with Squared Euclidean Distance And Euclidean Distance

  4. Manhattan (aka “Taxicab” or “City Block”) Distance

  5. Bray Curtis Dissimilarity and Canberra Distance

  6. Cosine Distance

  7. What Metrics Not to Use

  8. Omitting Class Labels - Using KMeans Clustering

How guided projects work

Your workspace is a virtual desktop right in your browser, no download required

In a split-screen video, your instructor guides you step-by-step

Preguntas Frecuentes

Preguntas Frecuentes

  • Al comprar un proyecto, obtendrás todo lo que necesitas para completarlo, incluido el acceso a un espacio de trabajo de escritorio en la nube a través de tu navegador web que contiene los archivos y el software que necesitas para comenzar, además de instrucciones de video paso a paso de un experto en la materia.

  • Dado que tu espacio de trabajo contiene un escritorio en la nube del tamaño de una computadora portátil o computadora de escritorio, los proyectos no están disponibles en tu dispositivo móvil.

  • Los instructores de proyectos son expertos en la materia que tienen experiencia en habilidades, herramientas o dominios de su proyecto y les apasiona compartir sus conocimientos para impactar a millones de estudiantes en todo el mundo.

  • Puedes descargar y conservar cualquiera de tus archivos creados del proyecto. Para hacerlo, puedes usar la función 'Explorador de archivos' mientras accedes a tu escritorio en la nube.

  • La ayuda financiera no está disponible para proyectos.

  • No necesitas ninguna experiencia previa para comenzar con un proyecto. Un instructor te guiará a través del proyecto, paso a paso.

  • Sí, todo lo que necesitas para completar tu proyecto estará disponible en un escritorio en la nube que estará disponible en tu navegador.

  • Aprenderás completando tareas en un entorno de pantalla dividida directamente en tu navegador. En el lado izquierdo de la pantalla, completarás la tarea en tu espacio de trabajo. En el lado derecho de la pantalla, verás a un instructor guiarte a través del proyecto, paso a paso.