DSML KZ Новости - Новость

Запись DSML Reading Club #2 уже на канале!

Ануар Таскынов рассказал про Visual Geometry Grounded Transformer

VGGT — это foundation-модель нового поколения для задач 3D компьютерного зрения. Она способна по одному, нескольким или даже сотням изображений сцены сразу предсказывать ключевые 3D характеристики: параметры камеры, карты глубины, плотные облака точек и трекинг в 3D.

В отличие от традиционных подходов, VGGT работает как единая универсальная модель без необходимости в сложной постобработке, оставаясь при этом быстрой (менее 1 секунды на реконструкцию) и точной — она показывает SOTA-результаты по нескольким 3D задачам.

Хост семинара: Еламан Абдуллин
Скачать презентацию

Смотреть видео: youtube.com/watch?v=TVZoU1m5WKI