• Переключить сайт на версию для слабовидящих

Школа компьютерной лингвистики в ТюмГУ

logo_school_2022.png

Четвертая школа компьютерной лингвистики в ТюмГУ

Регистрация завершена

"Школа компьютерной лингвистики в ТюмГУ" - это трехдневный интенсив по ключевым направлениям компьютерной лингвистики и автоматической обработки текста. Обычно занятия проводятся по нескольким трекам (секциям): для новичков и для продвинутых пользователей.

11-16 июля 2022 в рамках Конференции пройдет Четвертая открытая школа компьютерной лингвистики в ТюмГУ. Занятия проводятся по двум направлениям.

1 трек. 11-13 июля 2022

Алексей Сорокин (кандидат физико-математических наук, МГУ им. Ломоносова, Research at Yandex)

“Трансформеры: архитектура нейронной сети”

В 2017 компания Google представила свою разработку - нейронную сеть нового типа: трансформер. Эта сеть успешно справляется с такими задачами, как генерация текста, ответы на вопросы, оценка тональности, и во многих из них до сих пор не знает конкурентов. На этой технологии основана языковая модель под названием BERT, разработанная Якобом Девлином и его коллегами в Google, а также GPT от компании OpenAI. В 2020 группа исследователей под руководством Татьяны Шавриной (Сбер) представила GPT-3: модель для русского языка.

На летней школе в течение трех дней вы познакомитесь с основами архитектуры трансформеров на примерах обработки текста:

  1. Для начала вспомним, что такое нейронные сети и как с их помощью обрабатывать естественный язык.

  2. Сравним трансформеры и генеративные нейронные сети.

  3. Узнаем, что такое “внимание” (attention) и как устроена архитектура “кодировщик-декодировщик” (encoder-decoder).

  4. Разберемся в BERT, GPT и особенностях задачи seq2seq.

  5. Познакомимся с проектом Russian SuperGLUE и запустим языковые модели на задачах для русского языка. 

В итоге вы получите код проекта, который можно развивать для решения собственных задач.

Уровень сложности: высокий. Необходим опыт программирования на Python и понимание устройства нейронных сетей (например, если вы проходили МООКи на Coursera или OpenEdu).

Что взять с собой:

  1. ноутбук, позволяющий wi-fi доступ в Интернет (можно будет подключиться к сети ТюмГУ);

  2. на ноутбуке должен быть логин к аккаунту Google либо заранее установлен Jupyter Notebook;

  3. если вы будете работать в облачной среде программирования Google Colaboratory, то на ноутбуке должен быть браузер Google Chrome.

2 трек. 14-16 июля 2022

Обучение от компании Just AI (Санкт-Петербург, Россия)

“Создание чат-ботов на платформе JAICP”

Чат-боты - это программы, имитирующие живое общение с человеком. Современные технологии позволяют создавать чат-ботов, которые могут заменить (полностью или частично) операторов колл-центра, регистраторов, секретарей, учителей, тренеров и консультантов. Компания Just AI разрабатывает готовые решения и инструменты для создания ботов любой сложности. Платформа JAICP (Just AI Conversational Platform) - это комплекс таких инструментов. Платформа сочетает блочное программирование с написанием кода на языках JavaScript и Kotlin. Доступ к JAICP производится удаленно, через браузер.

На летней школе в течение трех дней вы познакомитесь с основами разработки чат-ботов на JAICP. Вы узнаете:

  1. что могут современные боты, с чем лучше всего справляются, какие плюсы и минусы у внедрения ботов в бизнес;

  2. с чего начинается проект чат-бота, как строится диалог с ботом, что такое “диалоговая машина состояний”;

  3. как создавать переменные и запоминать данные пользователя, как добавлять функции, например, подсчет суммы чека или таймер;

  4. как интегрировать бота в разные сервисы, как хранить и получать данные;

  5. что такое NLU - Natural Language Understanding, как искусственный интеллект помогает понять пользователей, которые общаются по-разному.

В итоге вы получите MVP чат-бота, с которым можно поговорить через Алису или в Телеграм.

Уровень сложности: средний. Будем программировать на языке JavaScript, но знать язык необязательно. Достаточно иметь общее представление о том, зачем он нужен и как работает. Вот здесь есть хороший учебник, если есть желание подготовиться.

Что взять с собой:

  1. ноутбук, позволяющий wi-fi доступ в Интернет (можно будет подключиться к сети ТюмГУ);

  2. на ноутбуке должен быть браузер Google Chrome, т.к. продукты Just AI лучше всего работают в нем.

Лекторы Школы

1 трек

Алексей Сорокин. Кандидат физико-математических наук, старший преподаватель ОТиПЛ (отделения теоретической и прикладной лингвистики филологического факультета МГУ имени М. В. Ломоносова), автор и преподаватель курсов по компьютерной лингвистике и машинному обучению, исследователь (researcher) в Research at Yandex. Научные интересы: компьютерная лингвистика, лингвистическое моделирование, искусственный интеллект и нейронные сети, категориальные грамматики, теория формальных языков. Разрабатывает алгоритмы нейронных сетей для задач обработки естественного языка: морфологической разметки, проверки правописания, автоматического словоизменения и др. Список публикаций.

2 трек

Специалист компании Just AI (г. Санкт-Петербург). С 2011 года Just AI работает в сфере разговорного искусственного интеллекта и разрабатывает свою технологию понимания естественного языка NLU (Natural Language Understanding). Компания создает решения для бизнеса (полная автоматизация общения с клиентами) и частных разработчиков. На онлайн-конструкторе Aimylogic без использования кода можно сделать и запустить чат-бота в Телеграм за несколько минут. Just AI Conversational Platform (JAICP) - это более сложный продукт, который позволяет разрабатывать корпоративных AI-ботов, виртуальных ассистентов и навыки для них. Логика взаимодействия с чат-ботом прописывается при помощи специальных команд (язык JAICP DSL). Также можно встроить сценарий на популярном языке программирования JavaScript.

Формат участия

Школа открыта для всех желающих по предварительной регистрации.

Возможны две формы участия: очная и дистанционная (трансляция онлайн через Microsoft Teams). Число очных участников ограничено. Если будут ограничения в связи с пандемией, будет только дистанционный формат.

Занятия бесплатные. Тем, кто посетил все занятия, выдается сертификат участника.

В этом году мы открываем возможность получить не просто сертификат участника, а удостоверение о прохождении образовательного курса (повышение квалификации), если вы посетите все занятия и напишите финальный тест. Чтобы получить удостоверение, необходимо заключить договор до начала обучения в Центре дополнительного образования ТюмГУ. Удостоверение выдается по завершении курса.

Заявки принимаются до 7 июля 2022 (включительно).

Регистрация завершена

Прошедшие школы

Первая школа компьютерной лингвистики в ТюмГУ. 14-15 февраля 2018. 

1 трек: Тимофей Архангельский (Университет Гамбурга, Германия)
Основы компьютерной обработки текста и создания лингвистических корпусов при помощи языка программирования Python 3.

2 трек: Андрей Кутузов (Университет Осло, Норвегия)
Предсказательные дистрибутивно-семантические модели (word2vec, fastText и другие алгоритмы word embeddings) для задач обработки естественного языка, связанных с семантикой.

Школа компьютерной лингвистики 1

Вторая школа компьютерной лингвистики в ТюмГУ. 17-18 декабря 2018. 

1 трек: Тимофей Архангельский (Университет Гамбурга, Германия)
Введение в компьютерную лингвистику.

2 трек: Алексей Сорокин (МГУ им. Ломоносова, МФТИ, Россия)
Основы архитектуры нейронных сетей.

Школа компьютерной лингвистики 2

Третья школа компьютерной лингвистики в ТюмГУ. 27-28 июня и 2-4 июля 2019. 

1 трек: Мария Куниловская (Университет Вулвуерхемптона, Англия)
Создание и использование корпусов в лингвистических исследованиях.

2 трек: Владислав Мараев (Университет Гетеборга, Швеция)
Диалоговые системы в компьютерной лингвистике.

3 трек: Андрей Кутузов (Университет Осло, Норвегия)
Автоматическая обработка естественного языка при помощи нейронных сетей.

школа компьютерной лингвистики 3