6 августа 2025 г. в 12:21
На этом семинаре мы поговорим про — Diffusion Policy: Visuomotor Policy Learning via Action Diffusion (https://arxiv.org/pdf/2303.04137v4)
В работе представлен метод Diffusion Policy — новый способ генерации поведения робота, где визуомоторная политика моделируется как условный denoising diffusion процесс. Метод стабильно превосходит существующие, в среднем на 46.9%. Модель обучается градиенту функции плотности действий и во время инференса оптимизирует поведение через стохастическую динамику Ланжевена. Метод хорошо работает с многомодальными распределениями и высокоразмерными действиями, обеспечивая стабильное обучение. Ключевые технические решения: контроль с убывающим горизонтом, визуальная привязка и трансформер для временных рядов. Работа открывает путь к новым подходам обучения политик на базе диффузионных моделей.
• Суббота, 9 августа, 11:00 KZ Time
• Добавить в календарь
• Google Meet
• Speaker: James Yamazaki
• Host: Yelaman Abdullin