Acerca de este Curso
1,842 vistas recientes

100 % en línea

Comienza de inmediato y aprende a tu propio ritmo.

Fechas límite flexibles

Restablece las fechas límite en función de tus horarios.

Nivel intermedio

Aprox. 26 horas para completar

Sugerido: 6 недель обучения, 6-8 часов в неделю...

Ruso (Russian)

Subtítulos: Ruso (Russian)

100 % en línea

Comienza de inmediato y aprende a tu propio ritmo.

Fechas límite flexibles

Restablece las fechas límite en función de tus horarios.

Nivel intermedio

Aprox. 26 horas para completar

Sugerido: 6 недель обучения, 6-8 часов в неделю...

Ruso (Russian)

Subtítulos: Ruso (Russian)

Programa - Qué aprenderás en este curso

Semana
1
5 horas para completar

Введение, булев поиск

Этим занятием открывается цикл лекций, посвященных информационному поиску. Мы начнем с небольшого экскурса в историю возникновения вэб-поиска, изучим базовые понятия и узнаем, как можно классифицировать разные поисковые системы. Базовый вид поиска – это булев поиск. Мы рассмотрим, как он устроен и как можно исполнять запросы пользователей к такому поиску. Но недостаточно использовать оригинальный текст – чтобы учесть разные морфологические формы одного и того же слова, применяются различные этапы нормализации текста. Это применимо не только к документам, но и к запросам. Отдельно стоит рассмотреть такие важные усовершенствования булева поиска, как координатный поиск, которые учитывает, где именно в тексте находятся конкретные слова, и обработку полноценных фразовых запросов.

...
14 videos (Total 70 minutos), 2 readings, 5 quizzes
14 videos
МФТИ1m
История поисковых систем5m
Базовые понятия4m
Классификация поисковых систем4m
Основы булева поиска. Логические операции3m
Матрица инцидентности и переход к обратному индексу3m
Обработка запросов с обратным индексом4m
Зачем нужна нормализация18m
Определение языка3m
Стемминг2m
Лемматизация текста4m
Фразовые запросы4m
Координатный индекс3m
2 lecturas
Mail.Ru Group5m
Решение10m
4 ejercicios de práctica
Базовые понятия информационного поиска8m
Булев поиск и матрица инцидентности14m
Нормализация текста. Стемминг. Лемматизация10m
Фразовые запросы. Координатный индекс6m
Semana
2
4 horas para completar

Поисковый индекс

В основе текстового информационного поиска лежит концепция обратного индекса. Эта неделя посвящена разным методам его построения, расширения за счет дополнительной информации и улучшения работы с ним благодаря сжатию словаря и ускорению работы с обратным индексом.

...
9 videos (Total 48 minutos), 1 reading, 3 quizzes
9 videos
Построение индекса на реальной коллекции документов8m
Блочное индексирование. Распределенное индексирование6m
Инкрементальная индексация3m
Параметрические индексы и зонные индексы2m
Сокращение индекса, стоп-слова5m
Сжатие словаря6m
Сжатие инвертированного файла7m
Skip-листы2m
1 lectura
Решение10m
2 ejercicios de práctica
Обратный индекс, индексация10m
Сжатие индекса12m
Semana
3
5 horas para completar

Нечёткий поиск

Эта неделя посвящена двум большим темам, связанным между собой: исправление опечаток в запросах пользователей и выполнение неточных запросов, в которых пользователь сознательно скрывает часть слова за специальным знаком – "*".

...
9 videos (Total 54 minutos), 1 reading, 4 quizzes
9 videos
Структуры для словарей. Деревья8m
Нечёткий поиск5m
Перестановочный индекс3m
K-граммный индекс5m
Расстояние редактирования10m
Динамический алгоритм нахождения расстояние между словами3m
Фонетические исправления3m
Исправления в контексте4m
1 lectura
Решение10m
3 ejercicios de práctica
Структуры данных8m
Нечеткий поиск8m
Исправление ошибок14m
Semana
4
4 horas para completar

Ранжирование

Выполнение запросов пользователей на большом корпусе документов часто приводит к тому, что запросу удовлетворяет слишком много документов. Для того, чтобы пользователю не пришлось просматривать все найденные документы, поисковая система может отобрать из них только лучшие и показать пользователю в порядке "полезности". Этим занимается ранжирование, о котором и пойдет речь в этой неделе.

...
8 videos (Total 41 minutos), 1 reading, 3 quizzes
8 videos
Текстовое ранжирование5m
Модель мешка слов6m
Представление документов в виде векторов. Расстояние между документами3m
Tf-Idf4m
Принцип вероятностного ранжирования3m
Бинарная модель независимости6m
Переход от BIM к BM258m
1 lectura
Решение10m
2 ejercicios de práctica
Текстовое ранжирование10m
Вероятностная модель ранжирования14m
Semana
5
5 horas para completar

Ссылочное и поведенческое ранжирование

Эта неделя посвящена ссылочному и поведенческому ранжированию. Эти виды ранжирования опираются на связь между разными документами и информацию о поведении пользователя.

...
11 videos (Total 60 minutos), 1 reading, 3 quizzes
11 videos
Алгоритм PageRank4m
Итеративный подход для вычисления PageRank3m
Вычисления PageRank с помощью марковских цепей4m
Алгоритм HITS6m
Разновидности PageRank: тематический, персонализированный2m
Позиционный базис12m
Каскадные поведенческие модели8m
Join Relevance Examination Model (JRE)6m
Релевантность и привлекательность6m
ClickRank и BrowseRank3m
1 lectura
Решение10m
2 ejercicios de práctica
Ссылочное ранжирование10m
Поведенческое ранжирование14m
Semana
6
6 horas para completar

Оценка качества

В этой неделе мы поговорим о том, зачем нужно оценивать качество поиска и как это можно сделать.

...
9 videos (Total 66 minutos), 3 quizzes
9 videos
Методы оценки качества9m
Оффлайн-метрики13m
Асессоры и асессорская оценка7m
DCG4m
A/B тестирование8m
Interleaving4m
Team-Draft Interleaving4m
Оценка поисковых сниппетов4m
2 ejercicios de práctica
Оценка качества поиска14m
Оценка качества поиска14m

Acerca de Instituto de Física y Tecnología de Moscú

Московский физико-технический институт (неофициально известный как МФТИ или Физтех) является одним из самых престижных в мире учебных и научно-исследовательских институтов. Он готовит высококвалифицированных специалистов в области теоретической и прикладной физики, прикладной математики, информатики, биотехнологии и смежных дисциплин. Физтех был основан в 1951 году Нобелевской премии лауреатами Петром Капицей, Николаем Семеновым, Львом Ландау и Сергеем Христиановичем. Основой образования в МФТИ является уникальная «система Физтеха»: кропотливое воспитание и отбор самых талантливых абитуриентов, фундаментальное образование высшего класса и раннее вовлечение студентов в реальную научно-исследовательскую работу. Среди выпускников МФТИ есть Нобелевские лауреаты, основатели всемирно известных компаний, известные космонавты, изобретатели, инженеры....

Acerca de Mail.Ru Group

Mail.Ru Group, международный бренд My.com – крупнейший холдинг в России по дневной мобильной аудитории. В рамках стратегии communitainment Mail.Ru Group развивает единую интегрированную платформу коммуникационных и развлекательных интернет-сервисов. Компании принадлежат лидирующий почтовый сервис, один из крупнейших порталов в рунете, крупнейшие русскоязычные социальные сети – ВКонтакте, Одноклассники и Мой Мир, а также два популярных в России и СНГ мессенджера – Агент Mail.Ru и ICQ....

Preguntas Frecuentes

  • Una vez que te inscribes para obtener un Certificado, tendrás acceso a todos los videos, cuestionarios y tareas de programación (si corresponde). Las tareas calificadas por compañeros solo pueden enviarse y revisarse una vez que haya comenzado tu sesión. Si eliges explorar el curso sin comprarlo, es posible que no puedas acceder a determinadas tareas.

  • Cuando compras un Certificado, obtienes acceso a todos los materiales del curso, incluidas las tareas calificadas. Una vez que completes el curso, se añadirá tu Certificado electrónico a la página Logros. Desde allí, puedes imprimir tu Certificado o añadirlo a tu perfil de LinkedIn. Si solo quieres leer y visualizar el contenido del curso, puedes participar del curso como oyente sin costo.

¿Tienes más preguntas? Visita el Centro de Ayuda al Alumno.