Джерела
- Ars Technica AI
Подивись у дії
Переглянь моделі та стилі, що стоять за такими історіями — безкоштовний акаунт, галерея одразу.
Nvidia розгорнула команди агентів із кодування ШІ для автономного керування навчанням роботів, навчаючи машини виконувати фізичні завдання з апаратним забезпеченням — зокрема встановлювати GPU та перерізати кабельні стяжки — без покрокового програмування з боку людини.
Система, про яку повідомляє Ars Technica, — це не єдина модель ШІ, що видає команди. Це скоординована команда агентів із кодування — кожен відповідає за різні частини завдання, — які спільно пишуть і вдосконалюють програми для навчання роботизованих маніпуляторів. Один агент може генерувати код-кандидат для руху захоплення; інший оцінює, чи впорався робот; третій переписує процедуру на основі даних про збої. Цикл триває, доки робот не досягне порогового показника продуктивності.
Така архітектура важлива, оскільки вона обходить одну з найскладніших проблем робототехніки: необхідність того, щоб людські експерти вручну розробляли навчальні сценарії для кожного нового завдання. Оскільки агенти з кодування беруть на себе ітерації, Nvidia може масштабувати кількість і різноманітність завдань без пропорційного збільшення команди інженерів.
Вибір встановлення GPU як демонстраційного завдання був навмисним. Правильне встановлення відеокарти вимагає рівномірного тиску по всій довжині роз'єму, уникаючи при цьому пошкодження сусідніх компонентів — завдання, що потребує як калібрування зусилля, так і просторової точності. Перерізання кабельних стяжок додає інший виклик: робот повинен знайти маленьку гнучку ціль і докласти рівно стільки зусиль, щоб перерізати її, не зісковзнувши. Жодне із завдань не є абстракцією контрольованої лабораторії. Обидва безпосередньо відповідають реальним роботам з обслуговування дата-центрів — саме там очевидно лежать комерційні інтереси Nvidia.
Для авторів, які працюють із генерацією зображень і відео за допомогою ШІ, наслідки стосуються інфраструктури. Ті самі дата-центри, що обслуговують моделі генерації Charmloop та всі інші GPU-залежні сервіси ШІ, є об'єктами, на які Nvidia націлює цю автоматизацію. Роботи, здатні надійно встановлювати та обслуговувати апаратне забезпечення GPU у великих масштабах, можуть усунути кадрове вузьке місце у розширенні обчислювальних потужностей — що наразі є одним із ключових обмежень швидкості, з якою провайдери можуть нарощувати пропускну здатність генерації та знижувати витрати.
Ширша закономірність тут варта уваги. Агенти з кодування ШІ — та сама категорія інструментів, що змінює робочі процеси розробки програмного забезпечення, — тепер застосовуються на рівень нижче, до фізичних систем, на яких працює ШІ. По суті, Nvidia використовує ШІ для побудови кращої інфраструктури ШІ.
Це інший варіант використання, ніж моделі кодування з відкритим вихідним кодом, з якими автори ШІ-арту експериментували для автоматизації власних конвеєрів генерації зображень. Але базова логіка та сама: дозволити агентам виконувати ітеративну, насичену кодом роботу, яку люди вважають нудною та схильною до помилок. У випадку Nvidia «результатом» є навчений робот, а не власний робочий процес ComfyUI — але структурно петля ітерацій під керуванням агентів ідентична.
Автори, які використовують інструменти на основі стеку Nvidia — а це більшість великих платформ генерації зображень, — є кінцевими споживачами цього дослідження, незалежно від того, взаємодіють вони з ним безпосередньо чи ні. Якщо система запрацює у масштабі, це прискорить цикли розгортання апаратного забезпечення, що своєю чергою вплине на швидкість, з якою провайдери зможуть впроваджувати моделі наступного покоління та розширювати потужності без звичних затримок через дефіцит GPU.
Nvidia не оголосила терміни комерційного випуску системи. Публічно існує лише дослідницька демонстрація, однак історія компанії щодо швидкого переходу від досліджень до виробництва — особливо у всьому, що стосується її власної апаратної екосистеми, — свідчить про те, що це ближче до пункту дорожньої карти, ніж до віддаленого експерименту. Рішення щодо обчислювальної інфраструктури, що формують якість генерації ШІ у 2027 році, приймаються вже зараз.