News
Latest news and updates from DSML Kazakhstan community
Stay up to date with the latest events

В минувшую субботу прошел beetech 2025. В этом году на конференции помимо General стрима, был стрим AI&Beyond, где половина докладов была представлена резидентами нашего сообщества. Абылайхан Турласов поделился хаками использования guided decoding при работе с ЛЛМками. Михаил Шкорин рассказал как можно останавливать подмену видео при авторизации. Диас Халниязов поведал о нюансах создания AI парсера, а Ренат Алимбеков разобрал типичные ошибки AI/ML-проектов и ответил на важный вопрос: Локхид настоящий?

DSML Reading Club Meeting # 4 Уже послезавтра Асель Ермекова расскажет про статью где она является одним из авторов — Improved Sampling Algorithms for Lévy-Itô Diffusion Models Недавно было показано, что модели диффузии Леви-Ито с изотропным α-устойчивым шумом улучшают генерацию изображений на несбалансированных данных. Однако используемые алгоритмы выборки решают лишь приближённые обратные уравнения, что снижает качество. В этой статье мы предлагаем семейство стохастических дифференциальных уравнений с идентичными маргинальными распределениями и показываем, что...

Запись DSML Reading Club #2 уже на канале! Ануар Таскынов рассказал про Visual Geometry Grounded Transformer VGGT — это foundation-модель нового поколения для задач 3D компьютерного зрения. Она способна по одному, нескольким или даже сотням изображений сцены сразу предсказывать ключевые 3D характеристики: параметры камеры, карты глубины, плотные облака точек и трекинг в 3D. В отличие от традиционных подходов, VGGT работает как единая универсальная модель без необходимости в сложной постобработке, оставаясь при этом быстрой (менее 1 секунды на реконструкцию) и точной...

Запись DSML Reading Club #1 уже на канале! Еламан Абдуллин рассказал про Byte Latent Transformer Современные LLM опираются на токенизацию, что ограничивает их гибкость, снижает эффективность и делает их уязвимыми к редким и неформатным входам. Статья предлагает Byte Latent Transformer (BLT) — новую архитектуру, работающую напрямую с байтами. BLT использует динамические патчи, адаптирующиеся к сложности данных, и впервые достигает сравнимого с токенизированными моделями качества при лучшей эффективности и масштабируемости. Смотреть видео: youtu.be/JN-adAvbAcs

DSML Reading Club Meeting # 3 На этой неделе Михаил Шкорин расскажет про эмбеддинги графов — Optimal Time Complexity Algorithms for Computing General Random Walk Graph Kernels on Sparse Graphs Текущие методы построения графовых эмбеддингов страдают от отсутствия теоретической обоснованности (GNN) или высокой вычислительной сложности (kernel-подходы) Статья предлагает простой и масштабируемый алгоритм, который обеспечивает эффективное сравнение графов и их узлов через линейную аппроксимацию random walk kernels На встрече мы обсудим: - Зачем вообще нужны эмбеддинги...

Оффлайн-арена LLM для казахского языка Резиденты нашего сообщества Санжар Мурзахметов, Санжар Умбет, Бексултан Cагындык и Кирилл Якунин запустили первую оффлайн-арену LLM для казахского языка! Главная цель — проверить не просто генерацию следующего токена, а понимание культурного контекста в целом. Что было сделано: • Собрали кастомный QA-датасет с культурным фокусом. • Использовали Serper, Perplexity и LLM-генерацию, вместе с лингвистами собрали темы и ключевые слова • Модели сравнивались в парах: сначала с помощью GPT-4o, в финале — через модель Bradley-Terry....

Завершилась первая в Казахстане Республиканская AI Олимпиада для школьников! Это был тяжелый AI марафон включащий целых 7 kaggle-соревнований и предлагающий совершенно новый формат соревнований как для самих участников, так и для организаторов. До конца дошли 40 финалистов, прошедших через 2 удаленных раунда и 2 дня очного контеста в Астане. Мы надеемся что данная олимпиада сможет привлечь внимание талантливой казахстанской молодежи к перспективному направлению и повлияет на развитие Искусственного Интеллекта в нашем регионе. Поздравляем всех призеров олимпиады и...

DSML Reading Club Meeting # 2 На следующей неделе Ануар Таскынов расскажет про VGGT — Visual Geometry Grounded Transformer VGGT — это foundation-модель нового поколения для задач 3D компьютерного зрения. Она способна по одному, нескольким или даже сотням изображений сцены сразу предсказывать ключевые 3D характеристики: параметры камеры, карты глубины, плотные облака точек и трекинг в 3D. В отличие от традиционных подходов, VGGT работает как единая универсальная модель без необходимости в сложной постобработке, оставаясь при этом быстрой (менее 1 секунды на...

В этом году Сообщество DSMLKZ совместно с CPFed организовывает первую Республиканскую AI-олимпиада для школьников, Мы собрали участников со всей страны, чтобы выявить и поддержать юные таланты в области искусственного интеллекта. Олимпиада проходит в три этапа: - Отборочный раунд — комбинированный пул задач из спортивного программирования и машинного обучения. - Homework Kaggle Competition — настоящее Kaggle соревнование для 40 финалистов. - Offline Final — два тура, где участники за 2 дня решают 4 задачи в стиле Kaggle по ML, CV и NLP. В этой статье мы поздравим...