Не так давно один процессор монополизировал рынок, благодаря своим впечатляющим вычислительным возможностям, подпитывая бум развития генеративного искусственного интеллекта, но технология машинного обучения движется вперёд экспоненциальными темпами. Nvidia H100, представленный в 2022 году, — это графический процессор (GPU), который установил стандарт и проложил путь для Blackwell B200 и грядущей архитектуры Rubin. Хотя стоимость чипа от Nvidia в 40 тысяч долларов изначально была немаленькая, но даже он уже уступает более совершенным преемникам.

Создание приложений генеративного искусственного интеллекта — дело дорогостоящее, как с точки зрения денежных затрат, так и с точки зрения вычислительной мощности, необходимой для обучения необходимых моделей. На самом деле, процесс настолько требовательный, что справиться с этим могут лишь немногие процессоры, а по мере того, как акцент смещается в сторону «физического ИИ» и робототехники, этот спрос только возрастает. Конечно, микрочипы окружают нас повсюду. Ноутбук, на котором пишется этот текст, и устройство, на котором его можно прочитать на сайте, не смогли бы функционировать без них. И по мере того, как растут наши ожидания от возможностей всевозможных различных гаджетов, вычислительные способности становятся всё мощнее.

Чтобы оценить разницу в вычислительной мощности, не нужно быть компьютерным экспертом – цифры говорят сами за себя. Компьютер, использовавшийся в космических полётах «Аполлон», имел в арсенале всего 4 килобайта оперативной памяти и 72 КБ ПЗУ – ничтожно малую долю современных устройств, но достаточную для того, чтобы направить астронавтов на Луну. H100 имеет 80 гигабайт (ГБ) – это 80 миллиардов байт. Между тем, более новый Blackwell B200 имеет 192 ГБ. Именно это дополнительное пространство позволяет искусственному интеллекту перейти от простых чат-ботов к «агентскому ИИ», способному анализировать и исполнять многоэтапные задачи.

Как ни парадоксально, но процессор H100 также является частью другой революции в вычислительной мощности, так как изначально он представляет собой графический процессор, разработанный для быстрого отображения графики на экране мониторов высокого разрешения для игр и видео. Фактически, компания Nvidia создала первый графический процессор ещё в 1999 году. С тех пор их превосходная вычислительная мощность сделала их предпочтительным выбором для обработки огромных объёмов данных, необходимых для искусственного интеллекта. Компания контролирует до 95% рынка процессорных ускорителей, но характер этого рынка изменился. Многие крупнейшие операторы центров обработки данных, больше не являются просто клиентами-потребителями, а становятся конкурентами, разрабатывающими специализированные интегральные схемы (ASIC) для искусственного интеллекта, чтобы снизить зависимость от сторонних производителей микросхем.

Хотя H100 был отраслевым стандартом, именно GH200 Grace Hopper Superchip — названный в честь американской пионерки программирования Грейс Мюррей Хоппер — коренным образом изменил правила игры, объединив центральный и графический процессоры в единый «мозг» с огромным объёмом общей памяти в 624 Гигабайта. Эта архитектура проложила путь для нынешнего Grace Blackwell B200, который обеспечивает в 30 раз большую производительность по сравнению с H100 в задачах инференции.

Для удовлетворения растущего спроса на генеративный искусственный интеллект центрам обработки данных требуются ускоренные вычислительные платформы со специализированными потребностями. Сегодня это наследие продолжает жить в платформе Rubin, запуск которой запланирован на конец 2026 года. Эта система, объединяющая шесть новых чипов, призвана сократить затраты на ИИ ещё в десять раз, превратив центры обработки данных в полномасштабные «фабрики ИИ», способные к физическому ИИ — науке обучения машин взаимодействию с реальным миром.

Это также повысит эффективность в пять раз, что крайне важно — учитывая, что в настоящее время ИИ использует 100 зеттафлопс (секстилион операций с плавающей запятой), тогда как в 2022 году этот показатель составлял всего 1 зеттафлопс. Для каждой рабочей нагрузки действительно необходимы соответствующие вычислительные мощности, а это значит, что нужны графические процессоры (GPU), центральные процессоры (CPU), нейронные процессоры (NPU) и специализированные ускорители. Именно в облаке обучаются самые большие модели и где интеллектуальные решения предоставляются миллиардам пользователей в режиме реального времени. Для разработчиков облако предоставляет мгновенный доступ к огромным вычислительным мощностям, новейшим инструментам и возможности развертывания и масштабирования по мере развития сценариев использования. В будущих поколениях разрабатываются чипы и платформы, способные обрабатывать постоянно растущие потоки информации, обладающие огромным объёмом памяти и вычислительной мощностью, что делает возможным выполнение сложных задач искусственного интеллекта в больших масштабах.

Сегодня ИИ перестал быть преимущественно инструментом повышения производительности на основе экранов и начал функционировать как физическая система в реальной экономике. Изменились не только возможности моделирования, но и скорость, с которой физический ИИ перешёл от лабораторных демонстраций к полевым пилотным проектам и начальному коммерческому внедрению. Воплощённые системы начали переходить от исследовательского этапа к промышленному, с использованием цифровых двойников, моделирования синтетических сред, сокращающих циклы итераций перед развёртыванием. На крупных мировых технологических выставках человекоподобные платформы позиционируются, как предназначенные для работы в реальных условиях. В то же время механизм внедрения совершенствовался, навыки всё чаще обрабатывались, передавались и внедрялись через экосистемы, поддерживаемые платформами моделирования и масштабируемыми конвейерами обработки данных.

Именно поэтому в физических отраслях решающим фактором стало управление ИИ, а не его технические возможности. Поскольку физические системы ИИ могут обновляться, распространяться и фактически «загружаться» с возрастающей скоростью, операционные риски могут расти быстрее, чем организационные структуры адаптируются. В физических средах сбои нельзя просто устранить постфактум. Как только ИИ начинает перемещать товары, координировать работу или управлять оборудованием, ограничивающим фактором становится не то, что системы могут делать, а то, как регулируются ответственность, полномочия и вмешательство. Там уже действуют последствия, а не просто вычисления. Как только ИИ начинает работать в физическом пространстве, ошибки перестают быть абстрактными или обратимыми. Они материализуются как сбои в работе и риски для безопасности, часто выходящие за пределы непосредственной точки отказа.

В отраслях, ориентированных на цифровые технологии, часто можно «изящно» преодолевать неудачи. Ошибочную рекомендацию можно отменить, протестировать или исправить в программном обеспечении. Физические операции редко предоставляют такую ​​гибкость. Производство приостанавливается, когда робот роняет деталь во время передачи или теряет равновесие, перемещаясь по цеху, предназначенному для людей. В таких условиях ИИ не просто оптимизирует процессы, перераспределяя риски между людьми и активами организаций. Вопрос заключается не в том, насколько точны системы ИИ в среднем, а в том, чётко ли определены ответственность, полномочия и порядок вмешательства в момент сбоя. Без такого регулирования в сфере ИИ масштаб усиливает уязвимость: чем быстрее развёртываются системы, тем быстрее распространяется неуправляемый риск.