Технология
On-premise ИИ для закрытого контура
Развертывание ИИ внутри инфраструктуры заказчика без передачи данных во внешние API и без зависимости от облака. Подходит для банков, госорганизаций, юридических служб и любых компаний с чувствительными данными и требованиями ИБ.
- Данные не покидают периметр компании
- Соответствие 152-ФЗ и внутренним политикам ИБ
- Работа в закрытом контуре без интернета
- Контроль и аудит со стороны ИБ-службы заказчика
- Обновления моделей через защищенный канал
Что это
Что такое on-premise ИИ
On-premise ИИ - это развертывание моделей и сопутствующей инфраструктуры внутри периметра заказчика: на его серверах, в его сети, под управлением его ИТ-службы. В противоположность облачным сервисам, где данные и запросы передаются внешнему провайдеру, on-premise решение полностью контролируется заказчиком. ИБ-служба видит, какие данные обрабатываются, куда уходят логи, кто имеет доступ к моделям и индексам.
Для регулируемых отраслей и компаний с чувствительными данными on-premise - единственный приемлемый формат. Банковская тайна, персональные данные, коммерческая тайна, гостайна не могут быть переданы внешнему провайдеру без серьезных юридических и репутационных последствий. Локальное развертывание решает эту проблему по умолчанию: данные не уходят наружу, и доказывать это не нужно - это конструктивное свойство архитектуры.
On-premise при этом не значит «изолированная система без обновлений». Архитектура предусматривает контролируемый канал для обновлений моделей и компонентов: через защищенный репозиторий, через ручную выгрузку или через специально согласованный шлюз. Это соответствует практике большинства корпоративных систем безопасности.
Когда нужно
Когда облачный ИИ не подходит
Регуляторные ограничения
- Персональные данные и 152-ФЗ
- Банковская тайна и требования ЦБ
- Гостайна и служебная тайна
- Импортозамещение и требования к отечественным решениям
Бизнес-ограничения
- Договорные обязательства о неразглашении
- Коммерческая тайна и интеллектуальная собственность
- Требования заказчиков к подрядчикам по работе с данными
- Зависимость от стабильности внешнего провайдера
Технические ограничения
- Закрытый контур без интернета
- Требования к латентности и контролю
- Необходимость интеграции с внутренними системами без выхода наружу
- Аудит и прослеживаемость каждого запроса
Архитектура
Архитектура on-premise развертывания
Базовая архитектура состоит из четырех контуров. Контур моделей - это серверы с развернутыми LLM, эмбеддинг-моделями и классификаторами. Контур данных - векторная база, индексы и хранилища документов. Контур приложений - API, веб-интерфейсы и интеграции с СЭД, CRM, порталом. Контур ИБ - логирование, мониторинг, контроль доступа и обновлений.
Все контуры разворачиваются в инфраструктуре заказчика: на физических серверах, виртуальных машинах или контейнерах в Kubernetes. Возможна работа полностью без интернета - для этого канал обновлений выводится в отдельный сегмент, а основная сеть изолируется. Это типовая практика для систем, работающих с гостайной.
Управление обновлениями - отдельный важный сценарий. Модели публикуются и обновляются регулярно, но в закрытом контуре нельзя просто скачать новую версию из открытой сети. Поэтому организуется защищенный канал: проверенные сборки выкладываются в локальный репозиторий, проходят верификацию ИБ-службы и только потом разворачиваются в продакшене. Это требует процесса, но позволяет сохранять актуальность моделей без компромиссов по безопасности.
Безопасность
Безопасность и комплаенс
On-premise ИИ упрощает прохождение проверок ИБ, потому что использует те же механизмы, что и остальные корпоративные системы: контроль доступа через AD/LDAP, журналирование событий, мониторинг сетевого трафика, регулярные обновления. Никакой «особой» инфраструктуры не требуется, и ИБ-служба не должна разбираться в специфике облачных AI-провайдеров.
Для систем, работающих с персональными данными, важно, что оператором ПДн остается заказчик: данные не передаются третьему лицу, не нужны дополнительные соглашения о трансграничной передаче и согласия пользователей. Это снимает значительный пласт юридических вопросов и упрощает соответствие 152-ФЗ.
Отдельно прорабатывается модель угроз для самой ИИ-системы: защита от извлечения данных через prompt-инъекции, ограничения на типы запросов, контроль ответов модели. На этапе аудита мы согласовываем модель угроз с ИБ-службой заказчика и фиксируем ее в технической документации.
Часто задаваемые вопросы
Частые вопросы про on-premise ИИ
Что такое on-premise ИИ простыми словами?
Это ИИ-система, которая работает на ваших серверах, под управлением вашей ИТ-службы, и не передает данные наружу. В отличие от облачных сервисов вроде ChatGPT, где запросы уходят внешнему провайдеру, on-premise система полностью изолирована в периметре компании. Подходит для регулируемых отраслей и компаний с чувствительными данными.
Можно ли работать в полностью закрытом контуре без интернета?
Да. Модели и компоненты разворачиваются один раз через защищенный канал, после чего система работает автономно. Для обновлений организуется отдельный сегмент сети или ручная выгрузка через одноразовые носители. Это типовая практика для систем с повышенными требованиями к ИБ.
Как обновлять модели в закрытом контуре?
Через защищенный канал обновлений: проверенные сборки моделей выкладываются во внутренний репозиторий, проходят верификацию (контрольные суммы, проверка подписи, тестовая инфраструктура), и только потом разворачиваются в продакшене. Этот процесс мы согласовываем с ИБ-службой на этапе аудита и фиксируем в регламенте.
Подходит ли on-premise ИИ под требования 152-ФЗ?
Да, on-premise развертывание упрощает соответствие 152-ФЗ: данные не передаются третьему лицу, оператором ПДн остается заказчик, обработка происходит на серверах заказчика. Не нужны дополнительные согласия пользователей на трансграничную передачу и соглашения с внешними обработчиками. Конкретная архитектура согласовывается с ИБ-службой на этапе аудита.
Какая инфраструктура нужна для on-premise ИИ?
Базовый стек - серверы с CPU (для большинства корпоративных задач GPU не требуется), сетевое хранилище для документов и индексов, средства виртуализации (KVM, VMware, OpenStack) или Kubernetes. Для типовых сценариев достаточно сервера с 32–64 ГБ RAM и SSD. Расширение под нагрузку делается горизонтально.
Можно ли on-premise ИИ работать с гостайной?
Да, при условии соблюдения требований по сертификации компонентов и физической инфраструктуры. Архитектура совместима с работой в изолированной сети и аттестованных помещениях. Конкретный набор мер согласовывается с заказчиком и регулятором - это всегда индивидуальный проект.
Можно ли совместить on-premise с облачными сервисами?
В принципе да, но это уже не «чистое» on-premise решение. Гибридные схемы (часть моделей локально, часть в облаке) применяются, когда часть задач не критична по конфиденциальности, а часть - критична. Такая архитектура должна проходить дополнительный аудит ИБ, потому что граница между контурами становится уязвимым местом.
Чем on-premise ИИ отличается от self-hosted?
Термины часто используются как синонимы. «Self-hosted» больше используется в IT-сообществе для open-source решений, развернутых на собственных серверах. «On-premise» - корпоративный термин, подчеркивающий, что инфраструктура находится в собственности и под управлением заказчика. На практике это одно и то же.
Связанные направления
Другие страницы про локальный ИИ, аудит необходимости и развертывание без облака.
Аудит необходимости ИИ
Инженерный аудит за 2–3 недели: где ИИ нужен, где избыточен и какой минимальный локальный прототип имеет смысл.
ИИ для юридических документов
Локальная классификация, извлечение реквизитов, поиск рисков и сравнение редакций договоров без передачи данных в облако.
Локальный RAG
Поисково-ответный контур по корпоративным документам в закрытом контуре, без интернета, с контролем источников.
Заявка
Обсудить on-premise развертывание ИИ
Расскажите про требования ИБ и инфраструктуру - вернемся с архитектурным предложением.
Что лучше приложить к заявке
- Какие задачи и какие типы данных будут обрабатываться.
- Какие требования ИБ и регуляторы релевантны.
- Есть ли закрытый контур и какие правила обновлений.
- Какая инфраструктура доступна для развертывания.