
Абу Канабек - интервью с золотым медалистом IOAI
Казахстан дебютировал на International Olympiad in Artificial Intelligence (IOAI) и занял 4-е место в командном зачёте. Лучшим в сборной стал 9-классник Абу Канабек — золото и 9-е место в личном зачёте. Поговорили с ним о его пути к награде, подготовке и планах на будущее.
Путь к золоту: бэкграунд, инструменты и что реально решает
У меня был олимпиадный опыт: до 9 класса — олимпиадная математика, затем — спортивное программирование. Такой сплав помогает быстро придумывать идеи и так же быстро их реализовывать.
Перед республиканской олимпиадой я частично прошёл курс РФМШ по машинному обучению, но формат AI-олимпиад новый, поэтому большую часть знаний пришлось добирать «на ходу» - на отборах, сборах и уже после.
Задачи республиканской олимпиады и сборов оказались близки к IOAI. Например, на республиканском этапе была задача про корги, где важнее было посмотреть кросс-корреляцию признаков, а не сразу обучать модели - этот подход почти один в один пригодился во втором туре IOAI. Была и задача на сопоставление медицинских отчётов - закрывала темы NLP и matching, которые встретились в финале. На сборах преобладали задачи по Computer Vision, и эта тема также часто всплывала на IOAI.
Такой набор задач помог сфокусировать самоподготовку: я самостоятельно разобрался с PyTorch благодаря бесплатному курсу на YouTube, базовыми трансформерами и много практиковался, дорешивая задачи республиканской олимпиады и участвуя в соревнованиях на Kaggle.
В итоге на IOAI получился интересный микс: чтобы побеждать, нужны и идеи, и знание конкретных фреймворков/архитектур. И хотя задачи на идейную составляющую преобладали, по моему мнению к формату AI олимпиад пока все-таки ближе программистский бэкграунд, перекос в математические олимпиады все-таки избыточен для решения таких прикладных задач
Rank | Name | Country/Region | Total Score | Medal |
---|---|---|---|---|
1 | Krzysztof Rojek | Poland | 542.05 | Gold |
2 | Kieran Chai Kai Ren | Singapore | 465.71 | Gold |
3 | Wang Jiayu | Singapore | 463.17 | Gold |
4 | Vershinin Mikhail | Russia | 460.69 | Gold |
5 | Beliaev Matvei | Russia | 442.75 | Gold |
6 | Garifullin Timur | Russia | 423.01 | Gold |
7 | Tymoteusz Stępkowski | Poland | 413.34 | Gold |
8 | Mușat Tudor-Ștefan | Romania | 403.67 | Gold |
9 | Kanabek Abu | Kazakhstan | 400.09 | Gold |
10 | Naoya Tokita | Japan | 399.04 | Gold |
11 | Roumak Das | India | 398.18 | Gold |
12 | Dimunkhametov Danis | Russia | 392.13 | Gold |
13 | Khloptonykh Andrei | Russia | 390.86 | Gold |
14 | Teo Lovmar | Sweden | 384.10 | Gold |
15 | Issatay Sultnabi | Kazakhstan | 380.37 | Gold |
16 | Nguyen Viet Trung Nhan | Vietnam | 379.43 | Gold |
17 | Cheng Lai Yin | Hong Kong, China | 373.16 | Gold |
18 | Arjun Tyagi | India | 366.18 | Gold |
19 | Soham Sen | India | 365.57 | Gold |
20 | Drokanov Oleg | Russia | 364.86 | Gold |
21 | Nguyen Huu Tuan | Vietnam | 361.66 | Gold |
22 | Kassymkan Zhanibek | Kazakhstan | 359.39 | Gold |
23 | Dawid Kot | Poland | 356.81 | Gold |
24 | Nguyen Phu Nhan | Vietnam | 351.81 | Gold |
Формат IOAI, роль GPT и впечатления
Это были мои первые международные соревнования, если не считать олимпиаду в Монголии по математике (участвовало 3 страны). Масштаб впечатлил, но больше всего запомнилось общение с ребятами из разных стран — с некоторыми даже обменялись подарками.
Что бы я хотел знать заранее:
- Изучите платформу. Часто через консоль/SSH работает быстрее и стабильнее.
- Ведите дневник экспериментов. К каждому эксперименту - что меняли, какие фичи/датасеты, целевая метрика. Иначе когда эксперимент завершится придется тратить время, чтобы вспомнить, что там было. Короче говоря, ведите логи ваших экспериментов и отправок.
- Больше верьте в себя. Казалось, что нас «порвут», а на деле у многих отбор был слабее. Не overestimate-те ваших соперников, на деле все может оказаться совсем по-другому!
- Отправляйте решения рано и часто. Меньше очередей и падений, больше итераций и калибровки по лидерборду. Вы сможете быстрее получить результат за отправку и сможете больше экспериментировать.
- Грамотно подключайте GPT. На IOAI была локальная мини ChatGPT. Дайте модели чёткий контекст, приложите бейзлайн (пусть объяснит/допишет части), попросите быстрый прототип/улучшения — и обязательно валидируйте результат. Старайтесь выжать из него максимум!
- Готовьтесь не только на сборах. После сборов перед олимпиадой обычно есть еще 1 месяц, во время которого можно усиленно готовиться.
- Домашку делайте на максимум. Первый тур оказался сильно связан с хоум-таском, поэтому вам потребуется меньше времени чтобы разобраться в условиях его задач.
Думаю, формат IOAI будет эволюционировать: будет меньше «гптшек»/автокомплита, больше вычислительных ресурсов и меньше технических проблем с отправкой решений.
Как будешь готовиться к следующей олимпиаде
Думаю лучшая подготовка прорешать отборы других стран, особенно тех кто хорошо выступили на самой олимпиаде**.** Школьники Польши, России, Сингапура доминировали на олимпиаде, так что видимо их тренера что-то понимают.
Теория машинного обучения тоже важна, но все-таки формат олимпиады такой, что я бы дал 20–80 в пользу практики. Я думаю теории нужно ровно столько, чтобы понимать, что и зачем ты делаешь.
При этом уже сейчас понятно, что у AI олимпиад для школьников есть некоторая специфика по сравнению с подобными “взрослыми” ивентами вроде тех, что проводятся на площадке Kaggle. В первую очередь из-за жестких ограничений по времени: олимпиада идет в течение одного дня, а kaggle несколько месяцев. Однако играть на победу в таких соревнованиях может быть слишком расточительно по времени, поэтому лучше разбирать отборы других стран.
Моё будущее с AI
Пока фокус на олимпиадах. Если будет возможность подключиться к ресёрч-проекту — с удовольствием: это ценно не только для резюме, но и для реального исследовательского опыта.
Чем, помимо олимпиад, может помочь DSMLKZ
На финал Республиканской олимпиады проходит около 40 человек - тогда как я уверен что талантливых школьников намного больше, просто они не знают о таком направлении.
Я думаю что нужно пытаться расширять воронку и популяризировать направление искусственного интеллекта в целом, чтобы больше ребят дошли до уровня отбора. Да и в целом, хочется чтобы дети знали что AI направление им посильно и до универа. Вы уже двигаетесь в эту сторону — желаю успехов!
Спасибо Ералыге за организацию этого замечательного интервью