1 мая 2025 г. в 12:26
На следующей неделе Ануар Таскынов расскажет про VGGT — Visual Geometry Grounded Transformer
VGGT — это foundation-модель нового поколения для задач 3D компьютерного зрения. Она способна по одному, нескольким или даже сотням изображений сцены сразу предсказывать ключевые 3D характеристики: параметры камеры, карты глубины, плотные облака точек и трекинг в 3D.
В отличие от традиционных подходов, VGGT работает как единая универсальная модель без необходимости в сложной постобработке, оставаясь при этом быстрой (менее 1 секунды на реконструкцию) и точной — она показывает SOTA-результаты по нескольким 3D задачам.
На встрече мы обсудим:
– Краткое введение в задачи 3D компьютерного зрения
– Обзор архитектуры и возможностей VGGT
– Почему эта модель важна и как она может применяться на практике
📄 Paper: VGGT: Visual Geometry Grounded Transformer (https://vgg-t.github.io/)
🗓 Calendar: https://calendar.app.google/3MLTmm99NSdBjZ3q9
📞 Google Meet: https://meet.google.com/wqi-crwg-ztp
🕔 Date & Time: Thu, May 8, 11:00 KZ Time
🗣 Speaker: Anuar Taskynov (https://linkedin.com/in/anuartask)
Ставьте огонек и добавляйте встречу в календарь, если будете с нами!