Comindware рассчитала стоимость корпоративного ИИ в России

К началу 2026 года российский рынок генеративного ИИ дошел до финансово взрослого вопроса: аренда GPU-мощностей в облаке или закупка собственных ускорителей, что дешевле на горизонте трех лет.

В управленческой среде распространено убеждение, что собственная инфраструктура всегда выгоднее и безопаснее. Comindware свела открытые тарифы Cloud.ru Evolution Compute, Yandex Cloud и Selectel в единую TCO-модель и нашла ответ, в котором это убеждение оказывается верным далеко не всегда. Управленческое правило, выведенное аналитиками компании: до 40% устойчивой загрузки GPU выигрывает облако, выше 60–70% и при горизонте от трех лет выигрывает собственный контур. Между этими порогами решение зависит от тарифа провайдера, цены электроэнергии и графика амортизации.

Самая наглядная часть расчета построена вокруг типовой для серьезного корпоративного ИИ-контура конфигурации, кластера из восьми GPU NVIDIA H100. По публичным тарифам российских облаков, при условии непрерывной нагрузки в 730 часов в месяц, такая машина за три года обойдется в 180–460 млн рублей в зависимости от провайдера. Закупка тех же восьми ускорителей H100 80ГБ потребует 10–20 млн рублей единовременного CapEx. Разрыв в 15–25 раз выглядит шокирующе и регулярно используется в продажах подрядчиков, продающих on-prem-решения, однако при разборе сметы он превращается в сравнение разных категорий: непрерывной операционной аренды с полной поддержкой против стоимости голых карт без серверного шасси, ЦОДа, электроэнергии, персонала и амортизации. Полный TCO собственного контура заказчик собирает из этих составляющих сам.

Поэтому реальная картина видна на трехлетней TCO-модели по трем сценариям нагрузки. Для малого контура на 1–3 одновременных пользователей локальное развертывание стоит около 722 тыс. рублей против 3,06 млн рублей в облаке. Для среднего контура на 5–10 пользователей соотношение выглядит как 2,125 млн рублей против 7,65 млн рублей. Для крупного контура от 50 пользователей, 13,6 млн рублей против 30,6 млн рублей. На устойчивой нагрузке on-prem стабильно дает экономию в три-четыре раза, но это правило работает только в зоне постоянной загрузки выше порогового значения. Если ИИ-нагрузка спайковая, выводы могут быть прямо противоположными.

Точку безубыточности GPU-инфраструктуры на трехлетнем горизонте параметрически оценил исследователь Олег Ивченко в публикации Zenodo 2026 года. Она лежит в коридоре 55–75% утилизации в зависимости от тарифа провайдера, стоимости электроэнергии и графика амортизации. Это означает, что компании, у которых ИИ-нагрузка активизируется эпизодически, например для еженедельного анализа корпоративных документов или в часы пиковых обращений в поддержку, на горизонте трех лет вряд ли увидят экономию от собственного оборудования. Напротив, организация с постоянно работающим клиентским ассистентом, юридическим RAG-агентом или круглосуточным чат-ботом для сотрудников имеет финансовый смысл считать собственный кластер.

«Самый частый просчет в смете на корпоративный ИИ, это путать строку дедицированной аренды GPU как услуги со строкой CapEx закупки железа и ставить их в одну колонку без поправки на загрузку, ЦОД, электроэнергию и амортизацию. Это разные категории затрат, и без честного профиля утилизации сравнение получается обманчивым в обе стороны. Реальный коридор, в котором собственная инфраструктура начинает обыгрывать облако, начинается примерно с 55–60% устойчивой утилизации GPU и горизонта от трех лет. Ниже этого порога даже самый дорогой облачный тариф остается эффективнее, потому что заказчик не оплачивает простой дорогого ускорителя», — говорит Виталий Шпак, генеральный директор Comindware.

К чисто финансовому расчету добавляется регуляторный слой. Для проектов, обрабатывающих персональные данные, и для контуров, попадающих под определения критической информационной инфраструктуры, требования 152-ФЗ и связанных нормативных актов о суверенитете данных часто перевешивают чистую экономику. Собственный контур исключает выход запросов и пользовательского контента за периметр организации, что снимает целый класс рисков утечек и ускоряет аттестацию. На практике это смещает порог выгодности on-prem в более низкий диапазон утилизации: часть стоимости облачного сценария в регулируемых отраслях связана не с инфраструктурой как таковой, а с дополнительной комплаенс-обвязкой, аттестованными сегментами и контурами защиты, и этот слой нередко удваивает фактическую цену облачной модели.

«Российский финансовый директор в 2026 году получает редкую возможность сделать выбор архитектуры ИИ как чисто финансовое решение, опираясь на цифры, а не на маркетинг подрядчиков. Тарифы российских облаков опубликованы, цены на закупку GPU прозрачны, формула TCO укладывается в одну страницу. Единственное, что требуется от заказчика, это честно оценить профиль нагрузки на горизонте трех лет. Если ИИ работает эпизодически, дешевле облако. Если он становится частью операционной модели и работает постоянно, считайте свой контур. Любая попытка решить вопрос ссылкой на абстрактную безопасность или абстрактное удобство облака приведет к перерасходу бюджета на десятки миллионов рублей», — добавляет Виталий Шпак.

Сравнительная таблица TCO за три года по трем сценариям нагрузки, расчет порога утилизации, разбор формулы (CapEx + OpEx × годы + энергия × PUE × часы + персонал) и комментарий по применимости правила к российским тарифам и требованиям 152-ФЗ опубликованы Comindware в составе отчета о коммерческом обосновании внедрения корпоративного ИИ. Этот материал разработан как готовый расчетный инструмент для финансовых и ИТ-руководителей и может использоваться при защите бюджета и переговорах с подрядчиками без дополнительной адаптации.

О компании Comindware

Comindware® — российская компания с историей более 10 лет, присутствует на глобальном рынке, разработчик Comindware Platform, low-code платформы для быстрого построения цифровой организации, управления бизнес-процессами, автоматизации и контроля работы. В 2018-м года компания впервые заняла первую строчку в рейтинге крупнейших разработчиков BPMS от CNews Analytics, с тех пор постоянно присутствует в отраслевых рейтингах. В 2019 году Gartner впервые поставил Comindware на первое место в своем рейтинге на основе отзывов пользователей и клиентов, лидирующее место в данном рейтинге осталось за Comindware и в последующие годы, 2020-2026.