Один агент — одна задача
Router для solo-founder.
ИИ в разработке
Одни команды ещё копируют ответы из чата в редактор, другие уже отдают часть задач фоновым агентам в облаке. Между ними — разные процессы, риски и инструменты. Эта статья — адаптация модели зрелости ИИ в жизненном цикле разработки по материалам доклада Ивана Поддубного. Она помогает понять свой уровень и принять осознанное решение: что внедрять сейчас, а что отложить.
Зрелость ИИ в разработке — не про «пользуемся ли мы ChatGPT». Это про то, насколько ИИ встроен в процесс: от разовых экспериментов до сквозного потока, где спецификация, код, тесты и проверки идут через одну систему. Большинству стартапов и небольших команд сейчас достаточно второго уровня — локальные агенты рядом с разработчиком. Третий уровень (облачные фоновые агенты) имеет смысл выносить параллельно, с лёгких сценариев, а не перепрыгивая через этапы.
На рынке одновременно живут два полюса. С одной стороны — чат, копипаст, нет общей системы. С другой — агенты в облаке, высокая автономность, минимум ручного контроля. Лидеры отрываются всё сильнее, а те, кто ещё не начинал, теряются в шуме. Одна и та же задача — «добавить фичу» или «починить баг» — решается совершенно по-разному. Без общей шкалы трудно строить архитектурные и организационные решения.
Ниже — процессная модель, ориентированная на уровень автономности агента и на то, как ИИ встроен в инженерный поток. Она дополняет известные рамки вроде Gartner AI Maturity Model и Stanford AI Adoption Model, но заточена именно под разработку продукта.
| Уровень | Название | Как это выглядит |
|---|---|---|
| 0 | Классический процесс | Код пишут люди, ИИ не используется в потоке |
| 1 | Чат как помощник | ИИ снаружи: спросил в браузере, вставил ответ вручную |
| 2 | Локальные агенты | Claude Code, Codex и аналоги: «экзоскелет» для разработчика, результат под ключ у человека |
| 3 | Облачный runtime | Фоновые агенты: часть задач без участия человека, человек — по запросу (HITL) |
| 4 | Полная автономность | Сквозное решение «под ключ» без человека — скорее ориентир, чем массовая практика |
На втором уровне агент работает на машине разработчика или основателя. Метафора — экзоскелет: вы усиливаете роль, но отвечаете за результат сами. Это самый распространённый и практичный уровень для маленьких команд в 2026 году.
Здесь можно дойти до очень высокой продуктивности. Но есть потолок: «фабрика» не работает сама — нужен ноутбук, с которого кто-то запускает агента. Для solo-founder или команды из 2–3 человек это часто плюс: меньше bus factor в облачной инфраструктуре, проще контроль.
Ключевое отличие: отдельные блоки или целые задачи решаются без участия человека. В остальных случаях человек подключается по требованию. На сложных кейсах — откат на уровень 2.
Автономность этого уровня достигается в облаке: вы не зависите от локального ноутбука, можете запускать десятки решений параллельно, ограничение — только в точках ревью. На практике команды, которые дошли до этого уровня, отдают фоновым агентам большую часть типовых задач, а сложное оставляют локальным агентам с человеком.
Стратегически разумно развивать второй уровень как основу и параллельно пробовать третий на узких сценариях. Не нужно гнаться за автономностью ради автономности — для многих стартапов локальные агенты закрывают 80% задач.
Важный принцип — Last Responsible Moment: откладывайте необратимые решения до момента, когда дальнейшая отсрочка отрезает важную альтернативу. Даже если сейчас не идёте в облачные агенты, не закрывайте дверь: выбирайте инструменты, совместимые с обоими уровнями.
Внедрять агентов в аналитику, разработку и тестирование без синхронизации — путь к дублирующим решениям и конфликтам. Правильнее — сквозной процесс со спецификациями (Spec Driven Development): одна спека, общий контекст, аналитик генерирует требования, разработчик — план и код, тестировщик — тесты, всё в одном потоке.
Можно взять готовый SDD-фреймворк (например, OpenSpec) и настроить под свои процессы. Для основателя без большой команды это означает: фиксировать задачу в спецификации до кода, а не прыгать сразу в чат с «сделай мне фичу».
Ниже — практики, которые усиливают локальный уровень и становятся обязательными при переходе к облачным агентам.
| Практика | Уровень 2 | Уровень 3 |
|---|---|---|
| Сквозной SDD | Фундамент | Фундамент |
| Проверки перед слиянием кода | Усиливает | Обязательно |
| Наблюдаемость трейсов агента | Усиливает | Обязательно |
| Песочница: временные окружения + изоляция | Усиливает | Обязательно |
| Правила HITL (человек в контуре) | Ручной контроль | Обязательно |
| Автотесты агентов (evals) | Усиливает | Критично |
| Лимиты ресурсов и стоимости | Собирать данные | Обязательно |
| Координация нескольких агентов | — | Обязательно |
| Модельно-независимый harness | Желательно | Критично |
| ИИ-шлюз (прокси к LLM) | Усиливает | Обязательно |
| Агент с консольным/SDK-режимом | — | Обязательно |
Зелёный тест-сьют, линтер, проверка типов, скан безопасности. На третьем уровне добавляют LLM-судью: соответствует ли патч исходной задаче, нет ли лишних изменений.
Полный трейс каждого запуска: промпт, вызовы инструментов, результат. На втором уровне можно экспортировать трейсы из локальных агентов в общую систему (LangFuse и аналоги) — это накапливает датасет для evals.
Любая деструктивная операция — удаление файлов, миграции, force push, установка новых зависимостей, правки в security-чувствительных файлах — требует явного подтверждения человека.
Агенту нужен headless-режим (CLI или SDK), а не только плагин в IDE. Поведение плагина и CLI должно совпадать — иначе настройки второго уровня не переносятся в фон. Плагин без консольной версии — тупик на пути к третьему уровню.
Не начинайте с «пусть агент сам всё смержит». Пять безопасных сценариев:
Solo-founder часто путает «зрелость в коде» и «зрелость в продажах». Для запуска и первых оплат достаточно уровней 1–2: чат как помощник и локальный агент вроде Claude Code или Codex. Этого хватит, чтобы быстро собрать MVP, поправить лендинг и автоматизировать рутину в разработке.
Не гонитесь за облачными агентами (уровень 3), пока нет хотя бы десяти разговоров с потенциальными клиентами. Фоновые агенты экономят время инженера, но не отвечают на вопрос «кто платит и за что». Пока нет сигналов спроса, облако — дорогое отвлечение от рынка.
Зрелость в разработке и зрелость в продажах — разные оси. Track To закрывает sales-harness: цель на 30–90 дней, KPI, SMART-трек и шаги, где ИИ помогает с сегментом и сообщениями, а фаундер проводит разговоры. Подробнее — в разделе про ИИ-кофаундера и статье про harness.
Каталог инструментов под конкретные шаги — на странице ИИ-сервисов для стартапов. Механика трека — в «Как это работает». Запуск одному с ИИ — в отдельном материале.
Практически нет. Без навыка работы с агентами, без evals и без проверок риски слишком высоки. Четвёртый уровень — ориентир «тёмной фабрики», а не типичный кейс.
Те, у которых нет headless-режима или SDK: только плагин в редакторе без совместимого CLI. При цели в облачные агенты такие инструменты лучше не выбирать как основу.
На втором уровне — желательно: единая точка для ключей, лимитов и учёта затрат. На третьем — обязательно, вместе с модельно-независимым harness это защищает от vendor lock-in.
Да — для MVP и первых правок. Уровень 3 имеет смысл после первых разговоров с клиентами, а не вместо них.
Нет. Track To закрывает sales-harness: цель, KPI и шаги к клиентам параллельно с разработкой.
Track To показывает, какие шаги отдать ИИ-агенту, а где нужны разговоры с рынком. Опишите продукт и цель на 30–90 дней.
Собрать планИсточник модели: «Уровни зрелости AI в SDLC 2026», Иван Поддубный, CTO Вебпрактик.