15 марта 2022
486
Креативить и кодить: что будет на первом дататоне CоцГума

В феврале 2011 года суперкомпьютер IBM Watson стал участником викторины Jeopardy! – английская версия «Своей игры». Эта телепередача стала легендарной: искусственный интеллект, который не был подключен к Интернету, смог дать больше правильных ответов, чем его соперники. Ими были два знатока: Брэд Раттер – обладатель самого большого выигрыша в программе, и Кен Дженнингс – рекордсмен по длительности беспроигрышной серии. 

База русскоязычной версии «Своей игры» и похожих викторин насчитывает десятки тысяч вопросов. Это культурное наследие и отличная платформа для развития систем с искусственным интеллектом. В массиве информации нейросеть сможет найти ответы максимально быстро и точно только при правильно заданных признаках и алгоритмах. Определить эти входящие условия в рамках одного из заданий попробуют участники первого дататона Института социально-гуманитарных наук. Его идейный вдохновитель и один из организаторов – Елена Михалькова, кандидат филологических наук, магистр информатики. 

«Дататон – это что-то вроде хакатона – форума, когда разработчики решают практическую задачу. Дататоны больше про данные, поиск скрытой информации, поиск принципа. Мероприятия такого формата проводятся в разных странах, в том числе и в России. Например, в 2019 году они появились в Высшей школе экономики. Теперь мы организуем их в ТюмГУ», – отмечает Елена Михалькова.  

Особенность хакатонов – соревновательный характер. Дататоны ее переняли. Участникам Первого дататона Института социально-гуманитарных наук нужно написать наиболее эффективную систему для решения одной из трех поставленных организаторами задач. Работать предстоит в командах. Важное правило – в команде должен быть один ноутбук, но лучше каждому иметь свой: это позволит закрепить знания, полученные на интенсиве, с которого начнется мероприятие. Инстенсив проведет Анастасия Башмакова, ассистент кафедры английской филологии и перевода. Он будет посвящен работе с языком программирования R.

«Инструменты этого языка программирования удобно использовать новичкам. С тем же Pyton не все так просто, хотя он тоже не самый сложный язык и отлично решает свои задачи. R прекрасен для визуализации. Используя его, можно без особых знаний в веб-обработке сделать хорошую иллюстративную страницу. Он удобен и для лингвистической работы. В своей диссертации я делала модель словаря на платформе Shiny apps – сайт, который функционирует на языке R, дает возможность сохранить проект на сервере и поделиться им с другими людьми. На интенсиве планируем рассказать и про формат презентации веб-страницы R Markdown. Он позволяет создавать вкладки, разделы, менять стиль оформления текста и при этом немного “весит” в плане объема», – рассказала Анастасия Башмакова.

На интенсиве участники узнают, как можно получить данные из датасета, визуализировать их и сделать выводы на основе результатов, предложенных кодом. Кстати, попробовать создать код можно будет на двух следующих этапах мероприятия. Каждый продлится в течение двух часов. Во время первого участники займутся проработкой гипотез, то есть как раз определением тех признаков, на основе которых будет работать система. Второй этап посвящен непосредственно кодингу. Результат работы команды представят в виде презентаций. По итогам защиты выберут двух победителей: лучшие по мнению экспертов и приз зрительских симпатий. 

Те участники дататона, которые будут решать задачу «Своей игры», продолжив работу вне мероприятия, смогут проверить свой код 25 июня во время проведения ежегодной молодежной научно-практической конференции «Множественность интерпретаций». В планах у Елены Михальковой и Анастасии Башмаковой организовать свою версию Jeopardy!

«Завершить конференцию я предлагаю вечерним мероприятием – провести свой вариант легендарной “битвы умов” искусственного интеллекта и знатоков: несколько раундов, соревноваться в которых будут люди и разработанные системы. Это могут быть работы участников нашего дататона, всем знакомая Алиса или система, созданная сотрудниками компании DeepPavlov, которая разрабатывает диалоговые системы», – пояснила Елена Михалькова.

Справка

Мероприятие пройдет 3 апреля в 501 аудитории Института социально-гуманитарных наук ТюмГУ (г. Тюмень, ул. Ленина, 23). Участникам не из ТюмГУ необходимо заранее прислать ФИО.

Дедлайн подачи заявок: 27 марта.
Подробности и форма регистрации здесь.


Источник:

Управление стратегических коммуникаций ТюмГУ



Поделиться
-BIO
Институт экологической
и сельскохозяйственной
биологии
ТюмГУ

625003, Тюменская область,
г. Тюмень, ул. Ленина, 25

Михаил Жак
Заместитель директора
(3452) 59-74-00
Марина Топтыгина
Руководитель учебного офиса
59-74-00 (вн. 17178)