29 авг 2022

Путевка в будущее для молодых талантов

Как банк ВТБ развивает технологические навыки школьников

В этом году банк ВТБ третий раз принял участие в научно-технологической программе «Большие вызовы» на базе образовательного центра «Сириус» и стал одним из кураторов направления «Большие данные, искусственный интеллект, финансовые технологии и машинное обучение». В нашем материале рассказываем, кто участвовал в программе, что за проект разрабатывали и какие перспективы ждут одаренных школьников.


Как систематизировать большие данные: проект команды ВТБ

В рамках программы «Большие вызовы» компании всегда предоставляют реальные кейсы. ВТБ каждый раз предлагает задания, которые можно реализовать в банке на практике. При этом предпочтение всегда отдается таким проектам, над которыми будет интересно работать и школьникам, и кураторам. А также эксперты рассчитывают, что школьники смогут за три недели решить задачу в полном объеме.

01_Путевка в будущее для молодых талантов
Команда проекта ВТБ © Образовательный центр «Сириус»

В этом году ВТБ предложил участникам программы кейс под названием «Разработка аналитического сервиса на открытых данных». В команду вошли шесть школьников — Кирилл Осинцев, Алексей Шербаков, Степан Юнда, Илья Гринюк, Всеволод Киричук, Юрий Соколов. Их наставниками стали сотрудники ВТБ — Лев Меркушов, Алексей Рябых и Василий Гаршин.

Под руководством экспертов ВТБ ребята отлаживали сервис, который позволит компаниям автоматизировать обработку и структурирование данных в открытом доступе — например, в соцсетях или новостных лентах. Это нужно для того, чтобы систематизировать информацию вокруг того или иного бренда, разделять эту информацию на нужные сегменты и выявлять закономерности в данных.
Вот как описывает суть проекта участник команды, школьник из Екатеринбурга Кирилл Осинцев:

«Мы создавали нейросеть, которая помогает фильтровать данные и получать сгруппированную информацию, которая интересует заказчика. Для того чтобы пользоваться нашей программой, клиенту нужно зайти на сайт, загрузить файл с данными в формате Excel-таблицы. После этого запускается наша модель кластеризации, которая и проводит анализ. При этом клиенту не требуется помощь разработчика».

02_Путевка в будущее для молодых талантов
Кирилл Осинцев © Образовательный центр «Сириус»

По ходу работы участники разобрались, как обрабатывать большие массивы текстовых данных, разработали и внедрили широкий спектр NLP-моделей — от базовых до state of the art (SOTA) — и собрали из разрозненных моделей сервис с пользовательским интерфейсом. Каждый школьник сначала работал над собственной задачей. Например, Всеволод Киричук из Ростова-на-Дону строил алгоритмы active learning — способ разметки данных и обучения на них нейросети:

«Вначале мы берем маленькую часть данных, размечаем ее вручную и обучаем на ней модель, потом она предсказывает все остальные примеры оставшегося кластера. Задания, которые оказались сложными для нее, мы размечаем снова и добавляем в нашу обучающую выборку. Так проходит несколько циклов, и наша обучающаяся выборка увеличивается. Она дополняется самыми сложными примерами из кластера, поэтому эффективность модели значительно повышается».

03_Путевка в будущее для молодых талантов
Всеволод Киричук © Образовательный центр «Сириус»

Другой участник проекта, Юрий Соколов из Жуковского, отвечал за внедрение одной из моделей кластеризации — DEEP k-MEANS:

«Сначала модель DEEP k-MEANS обучается делать сжатые представления текстов. Это позволяет лучше работать алгоритму кластеризации, потому что если весь текст сразу поместить в этот алгоритм, он будет плохо работать. Потом я инициализировал центры кластеров и дообучал их эмбеддинги, то есть векторные представления текста, чтобы они максимально ровно распределяли сжатые тексты по кластерам. Мои коллеги по команде Илья, Степан и Алексей тоже занимались кластеризацией. Степан делал тематическое моделирование, когда у одного текста может быть несколько тем, но только один кластер. Алексей занимался методом кластеризации BERT: брал языковую модель и считал две функции потери — на угадывание пропущенных слов текста и на расстояние между центрами и точками в кластерах. Илья занимался визуализацией сервиса и алгоритмом DBSCAN, который смотрит на все точки и рисует вокруг них какой-то радиус. Если у точек радиусы пересекаются, тогда они находятся в одном кластере».

Когда все участники проекта выполнили свои задачи, они объединили полученные разработки и представили концепт сервиса, который способен кластеризовать и классифицировать открытые данные. Ключевая функция сервиса — активное обучение, которое позволяет подстраиваться под каждого пользователя индивидуально.

Участники других команд смогли самостоятельно протестировать сервис и оценить его возможности. А команда проекта надеется, что они смогут доработать продукт, адаптировать под запросы банка и уже в следующем году внедрить сервис в систему ВТБ.


Как организован процесс на программе

04_Путевка в будущее для молодых талантов
Участники проекта за работой © Образовательный центр «Сириус»

Первоначальный отбор школьников проводит образовательный центр «Сириус». На смену приглашают около 400 детей, а на каждое направление — порядка 50. В первый день смены кураторы направлений — руководители компаний, представители вузов и корпораций — презентуют проекты, над которыми будут работать участники программы. Дети голосуют за те проекты, в которых хотят участвовать, и ранжируют их по уровням заинтересованности. По итогам голосования методист направления распределяет школьников, ориентируясь на их предпочтения. Единственное ограничение — на проект, который предоставляют компании, можно взять не более шести человек. В этом году в команде проекта ВТБ было как раз шесть участников.

Смена длится 24 дня, в этом году она проходила с 1 по 24 июля. Эксперты ВТБ приезжали на всю смену и работали с детьми шесть дней в неделю, с одним выходным в четверг. Наставники помогали ребятам решать задачу проекта на протяжении всей смены.


Какие перспективы у школьников-участников

В программе участвуют ученики 10–11 классов, еще несовершеннолетние, поэтому сразу после смены они не могут попасть на стажировку или работу. Но ребята состоят в рабочих чатах, продолжают общение с сотрудниками банка, могут задавать интересующие их вопросы. А само участие в программе, работа над реальной задачей и презентация итоговых результатов — это отличный кейс для портфолио и перспектива трудоустройства в будущем.

05_Путевка в будущее для молодых талантов
Участники проекта © Образовательный центр «Сириус»

«ВТБ системно поддерживает лучшие образовательные организации и тем самым помогает талантливой молодежи быть успешной в своем деле. Банк ведет открытый профессиональный диалог с молодым поколением и делится опытом и экспертизой, встраивая своих лучших экспертов в учебные программы в качестве преподавателей-практиков и менторов. Мы верим, что обучение — это лучшая инвестиция в собственную жизнь, а повышение квалификации — подтверждение намерения достичь самых высоких результатов», — сообщила Ольга Дергунова, заместитель президента — председателя правления Банка ВТБ, директор ВШМ СПбГУ.



Для справки

«Большие вызовы» — это научно-технологическая образовательная программа, которая стартовала в 2016 году и проходит ежегодно на базе образовательного центра «Сириус». По каждому из направлений талантливые школьники со всей России работают вместе с ведущими учеными, инженерами и разработчиками технологических компаний. Участники решают амбициозные задачи в сфере науки и технологий, которые становятся фундаментом для будущих прорывов.

В 2022 году в программе приняли участие 393 школьника из 72 российских регионов. Они работали над 68 проектами в 13 направлениях, от биологии и медицины до космических технологий и освоения Мирового океана. А партнерами «Больших вызовов» выступили более 100 компаний, институтов и школ, среди которых и банк ВТБ.