17 мая 2025 г. в 13:45
Ануар Таскынов рассказал про Visual Geometry Grounded Transformer
VGGT — это foundation-модель нового поколения для задач 3D компьютерного зрения. Она способна по одному, нескольким или даже сотням изображений сцены сразу предсказывать ключевые 3D характеристики: параметры камеры, карты глубины, плотные облака точек и трекинг в 3D.
В отличие от традиционных подходов, VGGT работает как единая универсальная модель без необходимости в сложной постобработке, оставаясь при этом быстрой (менее 1 секунды на реконструкцию) и точной — она показывает SOTA-результаты по нескольким 3D задачам.
Хост семинара: Еламан Абдуллин
Скачать презентацию
Смотреть видео: youtube.com/watch?v=TVZoU1m5WKI