DSML Reading Club Meeting # 2

DSML Reading Club Meeting # 2

На следующей неделе Ануар Таскынов расскажет про VGGT — Visual Geometry Grounded Transformer

VGGT — это foundation-модель нового поколения для задач 3D компьютерного зрения. Она способна по одному, нескольким или даже сотням изображений сцены сразу предсказывать ключевые 3D характеристики: параметры камеры, карты глубины, плотные облака точек и трекинг в 3D.

В отличие от традиционных подходов, VGGT работает как единая универсальная модель без необходимости в сложной постобработке, оставаясь при этом быстрой (менее 1 секунды на реконструкцию) и точной — она показывает SOTA-результаты по нескольким 3D задачам.

На встрече мы обсудим:
– Краткое введение в задачи 3D компьютерного зрения
– Обзор архитектуры и возможностей VGGT
– Почему эта модель важна и как она может применяться на практике

📄 Paper: VGGT: Visual Geometry Grounded Transformer (https://vgg-t.github.io/)

🗓 Calendar: https://calendar.app.google/3MLTmm99NSdBjZ3q9

📞 Google Meet: https://meet.google.com/wqi-crwg-ztp

🕔 Date & Time: Thu, May 8, 11:00 KZ Time

🗣 Speaker: Anuar Taskynov (https://linkedin.com/in/anuartask)

Ставьте огонек и добавляйте встречу в календарь, если будете с нами!

DSML Reading Club Meeting # 2

Comments