ИИ в разработке

Уровни зрелости ИИ в разработке: где вы сейчас и куда двигаться

Одни команды ещё копируют ответы из чата в редактор, другие уже отдают часть задач фоновым агентам в облаке. Между ними — разные процессы, риски и инструменты. Эта статья — адаптация модели зрелости ИИ в жизненном цикле разработки по материалам доклада Ивана Поддубного. Она помогает понять свой уровень и принять осознанное решение: что внедрять сейчас, а что отложить.

Короткий ответ

Зрелость ИИ в разработке — не про «пользуемся ли мы ChatGPT». Это про то, насколько ИИ встроен в процесс: от разовых экспериментов до сквозного потока, где спецификация, код, тесты и проверки идут через одну систему. Большинству стартапов и небольших команд сейчас достаточно второго уровня — локальные агенты рядом с разработчиком. Третий уровень (облачные фоновые агенты) имеет смысл выносить параллельно, с лёгких сценариев, а не перепрыгивая через этапы.

Почему разрыв такой большой

На рынке одновременно живут два полюса. С одной стороны — чат, копипаст, нет общей системы. С другой — агенты в облаке, высокая автономность, минимум ручного контроля. Лидеры отрываются всё сильнее, а те, кто ещё не начинал, теряются в шуме. Одна и та же задача — «добавить фичу» или «починить баг» — решается совершенно по-разному. Без общей шкалы трудно строить архитектурные и организационные решения.

Пять уровней зрелости

Ниже — процессная модель, ориентированная на уровень автономности агента и на то, как ИИ встроен в инженерный поток. Она дополняет известные рамки вроде Gartner AI Maturity Model и Stanford AI Adoption Model, но заточена именно под разработку продукта.

Уровень Название Как это выглядит
0 Классический процесс Код пишут люди, ИИ не используется в потоке
1 Чат как помощник ИИ снаружи: спросил в браузере, вставил ответ вручную
2 Локальные агенты Claude Code, Codex и аналоги: «экзоскелет» для разработчика, результат под ключ у человека
3 Облачный runtime Фоновые агенты: часть задач без участия человека, человек — по запросу (HITL)
4 Полная автономность Сквозное решение «под ключ» без человека — скорее ориентир, чем массовая практика

Уровень 2: локальные агенты — рабочая база для стартапа

На втором уровне агент работает на машине разработчика или основателя. Метафора — экзоскелет: вы усиливаете роль, но отвечаете за результат сами. Это самый распространённый и практичный уровень для маленьких команд в 2026 году.

Здесь можно дойти до очень высокой продуктивности. Но есть потолок: «фабрика» не работает сама — нужен ноутбук, с которого кто-то запускает агента. Для solo-founder или команды из 2–3 человек это часто плюс: меньше bus factor в облачной инфраструктуре, проще контроль.

Уровень 3: облако и фоновые агенты

Ключевое отличие: отдельные блоки или целые задачи решаются без участия человека. В остальных случаях человек подключается по требованию. На сложных кейсах — откат на уровень 2.

Автономность этого уровня достигается в облаке: вы не зависите от локального ноутбука, можете запускать десятки решений параллельно, ограничение — только в точках ревью. На практике команды, которые дошли до этого уровня, отдают фоновым агентам большую часть типовых задач, а сложное оставляют локальным агентам с человеком.

2 или 3 уровень: не «или», а параллельно

Стратегически разумно развивать второй уровень как основу и параллельно пробовать третий на узких сценариях. Не нужно гнаться за автономностью ради автономности — для многих стартапов локальные агенты закрывают 80% задач.

Важный принцип — Last Responsible Moment: откладывайте необратимые решения до момента, когда дальнейшая отсрочка отрезает важную альтернативу. Даже если сейчас не идёте в облачные агенты, не закрывайте дверь: выбирайте инструменты, совместимые с обоими уровнями.

Типовая ошибка: агенты в каждой роли по отдельности

Внедрять агентов в аналитику, разработку и тестирование без синхронизации — путь к дублирующим решениям и конфликтам. Правильнее — сквозной процесс со спецификациями (Spec Driven Development): одна спека, общий контекст, аналитик генерирует требования, разработчик — план и код, тестировщик — тесты, всё в одном потоке.

Можно взять готовый SDD-фреймворк (например, OpenSpec) и настроить под свои процессы. Для основателя без большой команды это означает: фиксировать задачу в спецификации до кода, а не прыгать сразу в чат с «сделай мне фичу».

Что внедрять при переходе с 2 на 3 уровень

Ниже — практики, которые усиливают локальный уровень и становятся обязательными при переходе к облачным агентам.

Практика Уровень 2 Уровень 3
Сквозной SDD Фундамент Фундамент
Проверки перед слиянием кода Усиливает Обязательно
Наблюдаемость трейсов агента Усиливает Обязательно
Песочница: временные окружения + изоляция Усиливает Обязательно
Правила HITL (человек в контуре) Ручной контроль Обязательно
Автотесты агентов (evals) Усиливает Критично
Лимиты ресурсов и стоимости Собирать данные Обязательно
Координация нескольких агентов Обязательно
Модельно-независимый harness Желательно Критично
ИИ-шлюз (прокси к LLM) Усиливает Обязательно
Агент с консольным/SDK-режимом Обязательно

Проверки перед слиянием

Зелёный тест-сьют, линтер, проверка типов, скан безопасности. На третьем уровне добавляют LLM-судью: соответствует ли патч исходной задаче, нет ли лишних изменений.

Наблюдаемость

Полный трейс каждого запуска: промпт, вызовы инструментов, результат. На втором уровне можно экспортировать трейсы из локальных агентов в общую систему (LangFuse и аналоги) — это накапливает датасет для evals.

Правила HITL

Любая деструктивная операция — удаление файлов, миграции, force push, установка новых зависимостей, правки в security-чувствительных файлах — требует явного подтверждения человека.

Агент с выходом на облако

Агенту нужен headless-режим (CLI или SDK), а не только плагин в IDE. Поведение плагина и CLI должно совпадать — иначе настройки второго уровня не переносятся в фон. Плагин без консольной версии — тупик на пути к третьему уровню.

С чего заходить в облачных агентов

Не начинайте с «пусть агент сам всё смержит». Пять безопасных сценариев:

  1. Консультации по реализации — агент прорабатывает подход, ничего не мержит.
  2. Первичное расследование инцидента — сбор логов, гипотезы причины.
  3. Ревьюер — авто-ревью pull request, решение за человеком.
  4. Починка flaky-тестов — узкий scope, проверка тем же тестом.
  5. Мелкие баги — с готовым воспроизведением и падающим тестом.

Для фаундера без команды

Пять уровней зрелости ИИ: от чата до облачных агентов

Solo-founder часто путает «зрелость в коде» и «зрелость в продажах». Для запуска и первых оплат достаточно уровней 1–2: чат как помощник и локальный агент вроде Claude Code или Codex. Этого хватит, чтобы быстро собрать MVP, поправить лендинг и автоматизировать рутину в разработке.

Не гонитесь за облачными агентами (уровень 3), пока нет хотя бы десяти разговоров с потенциальными клиентами. Фоновые агенты экономят время инженера, но не отвечают на вопрос «кто платит и за что». Пока нет сигналов спроса, облако — дорогое отвлечение от рынка.

Зрелость в разработке и зрелость в продажах — разные оси. Track To закрывает sales-harness: цель на 30–90 дней, KPI, SMART-трек и шаги, где ИИ помогает с сегментом и сообщениями, а фаундер проводит разговоры. Подробнее — в разделе про ИИ-кофаундера и статье про harness.

Каталог инструментов под конкретные шаги — на странице ИИ-сервисов для стартапов. Механика трека — в «Как это работает». Запуск одному с ИИ — в отдельном материале.

Частые вопросы

Можно ли перепрыгнуть сразу на четвёртый уровень?

Практически нет. Без навыка работы с агентами, без evals и без проверок риски слишком высоки. Четвёртый уровень — ориентир «тёмной фабрики», а не типичный кейс.

Какие инструменты «прибивают» к второму уровню?

Те, у которых нет headless-режима или SDK: только плагин в редакторе без совместимого CLI. При цели в облачные агенты такие инструменты лучше не выбирать как основу.

Нужен ли ИИ-шлюз маленькой команде?

На втором уровне — желательно: единая точка для ключей, лимитов и учёта затрат. На третьем — обязательно, вместе с модельно-независимым harness это защищает от vendor lock-in.

Достаточно ли уровня 1–2 для solo-founder?

Да — для MVP и первых правок. Уровень 3 имеет смысл после первых разговоров с клиентами, а не вместо них.

Зрелость в разработке равна зрелости в продажах?

Нет. Track To закрывает sales-harness: цель, KPI и шаги к клиентам параллельно с разработкой.

Хотите связать разработку и поиск клиентов в один трек?

Track To показывает, какие шаги отдать ИИ-агенту, а где нужны разговоры с рынком. Опишите продукт и цель на 30–90 дней.

Собрать план

Источник модели: «Уровни зрелости AI в SDLC 2026», Иван Поддубный, CTO Вебпрактик.