• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Компьютерная лингвистика

Программа профессиональной переподготовки 

Занятия проходят дистанционно на платформе Zoom

Программа “Компьютерная лингвистика” дает возможность слушателям, имеющим гуманитарное образование, овладеть современными инструментами автоматического анализа текста, освоить ключевые методы лингвистических технологий, обучиться использованию и оценке лингвистических парсеров, созданию корпусов, словарей и онтологий. Слушатели программы получают новую востребованную специальность. Программа предусматривает работу над исследовательским проектом и стажировку в профильных коммерческих компаниях и научно-исследовательских институтах.

Куратор и разработчик программы - Анастасия Бонч-Осмоловская, кандидат филологических наук, академический руководитель магистерской программы “Компьютерная лингвистика”.

Особенности программы

Чему вы научитесь?

  • Писать скрипты на Питоне для обработки текстов
  • Создавать и обрабатывать собственные корпуса текстов
  • Использовать статистические методы для анализа и визуализации текстовых параметров с помощью языка R
  • Использовать алгоритмы машинного обучения для классификации и кластеризации текстов, а также алгоритмы “deep learning”
  • Работать с лексикографическими инструментами, инструментами создания онтологий, параллельными двуязыковыми корпусами
  • Создавать правила, позволяющие автоматически извлекать информацию из массивов текста

Что вы узнаете?

  • Чем занимается современная компьютерная лингвистика?
  • Что включает в себя лингвистическая обработка текста?
  • Какие существуют полезные ресурсы и инструменты и как с ними работать?
  • Как измерять качество работы модулей лингвистического анализа?
  • Как ранжировать слова по значимости в текстах, по связанности между собой?
  • Какие подходы используются для машинного перевода?
  • Как автоматически определить “тональность” текста?
  • Как получить структурированные данные из неструктурированного текста?

 844

часов, в том числе 306 аудиторных часа.

Общий срок обучения — 8 месяцев.

150 000 ₽

Оплату можно разбить на несколько частей.

Скидки

студентам, слушателям программ ДПО ФГН и сотрудникам НИУ ВШЭ на основании Положений о скидках


Расписание занятий

Начало обучения: 12 октября 2020 года
Понедельник, среда с 19:10 до 22:00, суббота с 10:30 до 13:30

Выдаваемый документ

Диплом о профессиональной переподготовке установленного НИУ ВШЭ образца

Записаться на программу

Преподаватели

Толдова Светлана Юрьевна

Научно-учебная лаборатория по формальным моделям в лингвистике: Заведующий лабораторией

Шеянова Мария Викторовна

Департамент больших данных и информационного поиска: Приглашенный преподаватель

Поздняков Иван Сергеевич

Школа лингвистики: Старший преподаватель

Мороз Георгий Алексеевич

Школа лингвистики: Старший преподаватель

 

Содержание программы

Введение в математику

  • Множества и операции с множествами. Основы математической логики
  • Функции, графики функций
  • Вектора и матрицы и операции с ними
  • Комбинаторика и основы теории вероятности
  • Производные и интегралы

Базовая часть: Компьютерная лингвистика

  • Основные задачи и методы компьютерной лингвистики
  • Лингвистические корпуса и частотность
  • Автоматический морфологический анализ
  • Лексикографические ресурсы и словари
  • Основы машинного перевода
  • Онтологии и извлечение именованных сущностей

Экзамен по дисциплине «Компьютерная лингвистика»

Профильная часть: Программирование для лингвистов

  • Введение в Python
  • Знакомство с Python, git, PyCharm, Colab, Jupyter Notebook
  • Операторы ввода/вывода (print,display,input), списки, циклы
  • Типы данных
  • Функции
  • Работа с файлами, модуль os
  • Регулярные выражения
  • Работа с датасетами. Pandas
  • Собираем корпус: парсеры, краулеры, скрепперы
  • Морфологическая обработка
  • Частотные списки и n-грамы
  • Анализ данных и визуализация
  • Классы и объекты

Экзамен по дисциплине «Программирование для лингвистов»

Прикладные программы

  • Основы математической статистики
  • Язык R

Экзамен по дисциплине «Прикладные программы»