• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Компьютерная лингвистика

Программа профессиональной переподготовки

Программа “Компьютерная лингвистика” дает возможность слушателям, имеющим гуманитарное образование, овладеть современными инструментами автоматического анализа текста, освоить ключевые методы лингвистических технологий, обучиться использованию и оценке лингвистических парсеров, созданию корпусов, словарей и онтологий. Слушатели программы получают новую востребованную специальность. Программа предусматривает работу над исследовательским проектом и стажировку в профильных коммерческих компаниях и научно-исследовательских институтах.

Особенности программы

Чему вы научитесь?

  • Писать скрипты на Питоне для обработки текстов
  • Создавать и обрабатывать собственные корпуса текстов
  • Использовать статистические методы для анализа и визуализации текстовых параметров с помощью языка R
  • Использовать алгоритмы машинного обучения для классификации и кластеризации текстов, а также алгоритмы “deep learning”
  • Работать с лексикографическими инструментами, инструментами создания онтологий, параллельными двуязыковыми корпусами
  • Создавать правила, позволяющие автоматически извлекать информацию из массивов текста

Что вы узнаете?

  • Чем занимается современная компьютерная лингвистика?
  • Что включает в себя лингвистическая обработка текста?
  • Какие существуют полезные ресурсы и инструменты и как с ними работать?
  • Как измерять качество работы модулей лингвистического анализа?
  • Как ранжировать слова по значимости в текстах, по связанности между собой?
  • Какие подходы используются для машинного перевода?
  • Как автоматически определить “тональность” текста?
  • Как получить структурированные данные из неструктурированного текста?

Формат обучения

Начало обучения: 11 октября 2021 года

Форма обучения: Дистанционная, заочная

График обучения: понедельник, среда с 19:10 до 22:00, суббота с 10:30 до 13:30

Общий срок обучения: 8 месяцев

Общая трудоёмкость: 844 академических часа, в т.ч. 306 аудиторных часов

Преподаватели

Толдова Светлана Юрьевна

Научно-учебная лаборатория по формальным моделям в лингвистике: Заведующий лабораторией

Шеянова Мария Викторовна

Департамент больших данных и информационного поиска: Приглашенный преподаватель

Поздняков Иван Сергеевич

Школа лингвистики: Старший преподаватель

Мороз Георгий Алексеевич

Школа лингвистики: Старший преподаватель

 

Содержание программы

Введение в математику

  • Множества и операции с множествами. Основы математической логики
  • Функции, графики функций
  • Вектора и матрицы и операции с ними
  • Комбинаторика и основы теории вероятности
  • Производные и интегралы

Базовая часть: Компьютерная лингвистика

  • Основные задачи и методы компьютерной лингвистики
  • Лингвистические корпуса и частотность
  • Автоматический морфологический анализ
  • Лексикографические ресурсы и словари
  • Основы машинного перевода
  • Онтологии и извлечение именованных сущностей

Экзамен по дисциплине «Компьютерная лингвистика»

Профильная часть: Программирование для лингвистов

  • Введение в Python
  • Знакомство с Python, git, PyCharm, Colab, Jupyter Notebook
  • Операторы ввода/вывода (print,display,input), списки, циклы
  • Типы данных
  • Функции
  • Работа с файлами, модуль os
  • Регулярные выражения
  • Работа с датасетами. Pandas
  • Собираем корпус: парсеры, краулеры, скрепперы
  • Морфологическая обработка
  • Частотные списки и n-грамы
  • Анализ данных и визуализация
  • Классы и объекты

Экзамен по дисциплине «Программирование для лингвистов»

Прикладные программы

  • Основы математической статистики
  • Язык R

Экзамен по дисциплине «Прикладные программы»

Стоимость и условия

150 000 ₽

Есть возможность оплаты в рассрочку

Онлайн-оплата

Скидка на обучение

10% - слушателям, прошедшим обучение в Центре, на каждый последующий курс повышения квалификации

20% - cтудентам и сотрудникам НИУ ВШЭ на основании Положений о скидках

 

Документ об окончании

Оставить отзыв о программе