Не все AI-агенты одинаковы

Фреймворк, как классифицировать и приоритизировать агентские инициативы

👋 Привет, я Lenny. Каждую неделю я отвечаю на вопросы читателей про продакт, рост и ускорение карьеры. Ещё больше: Lenny's Podcast | Lennybot | How I AI | мои любимые AI/PM курсы, курс по публичным выступлениям, copilot для подготовки к собеседованиям

P.S. Забирай бесплатный годовой доступ к Lovable, Manus, Replit, Gamma, n8n, Canva, ElevenLabs, Amp, Factory, Devin, Bolt, Wispr Flow, Linear, PostHog, Framer, Railway, Granola, Warp, Perplexity, Magic Patterns, Mobbin, ChatPRD и Stripe Atlas — стань Insider-подписчиком. Да, это всерьёз.

Агенты сейчас на пике. Чуть ли не каждый день кто-то запускает нового или новый инструмент для управления ими. Уверен, у твоей команды прямо сейчас в бэклоге с полдюжины агентских идей. Это не значит, что сегодня нужно кровь из носу строить агента. Но значит, что ты обязан понимать, как агенты вписываются в твою стратегию и какие инвестиции тут уместны.

Hamza Farooq и Jaya Rajwani ведут два из самых высокорейтинговых и уважаемых курсов по сборке AI-агентов (Agent Engineering Bootcamp и Agentic AI for PMs) и потратили больше 50 часов на этот гайд. К концу поста ты поймёшь три типа агентов, как приоритизировать инициативы и как избегать типичных ловушек — с конкретными инструментами, платформами и кучей живых примеров.

Поехали.

P.S. Можешь послушать этот пост как подкаст: Spotify / Apple / YouTube.

За последний год мы провели один и тот же разговор минимум 30 раз. AI-лид открывает свой roadmap — обычно 5-10 «агентских» инициатив — и говорит: «Помоги нам понять, что строить первым».

Список обычно включает PM-ассистента, RAG-copilot, систему клиентской поддержки, code review агента и шопинг-ассистента с голосом.

Если ты это читаешь, скорее всего, у тебя похожий список. Команда горит, инвесторы спрашивают, конкуренты анонсят. Нужно что-то выбрать и отгрузить.

Вот тут большинство команд и застревает. Проблема не в нехватке идей — проблема в том, что они пытаются приоритизировать принципиально разные системы как одно и то же. Привычный подход — открыть матрицу impact-vs-effort и сравнить идеи бок о бок.

Но с AI-агентами это быстро разваливается. Один «агент» строится шесть недель. Другой — шесть месяцев. Одного продакт соберёт сам на n8n. Другому нужна выделенная ML-команда. Один стоит $500 в месяц. Другой нагенерит шестизначный счёт за LLM в год.

Ассистент клиентской поддержки и голосовой шопинг-агент — оба называются «агентами», но требуют разных архитектур, разных команд, разной инфраструктуры, разных сроков. Пока ты не видишь эти различия, любая попытка сравнивать «effort» и «impact» — по сути, гадание.

Относиться к архитектурно разным продуктам как к одной категории — значит делать нормальную приоритизацию практически невозможной. Приоритизация ломается не потому, что команды плохо планируют, а потому, что они сравнивают яблоки, апельсины и реактивные двигатели в одной таблице.

Недостающий шаг — иерархия

Прежде чем решить, какого агента строить первым, ответь на более базовый вопрос: какой тип агента, собственно, предлагает каждая идея?

Это определит почти всё, что важно для планирования:

Насколько сложно будет его построить
Какие навыки и инфраструктура нужны
Сколько это займёт времени
Сколько будет стоить в эксплуатации
Как мерить успех

Другими словами, категоризация — это не технический ритуал. Это фундамент умной приоритизации.

Этот пост даёт тебе фреймворк принятия решений, который ты можешь применить к текущей roadmap прямо сегодня.

Мы собрали его из паттернов, которые видели, помогая организациям превращать агентские идеи в реальные production-системы. Работая с enterprise-командами Fortune 500 — Jack in the Box, Tripadvisor, The Home Depot — мы обнаружили, что группировка идей по их архитектуре разблокирует приоритизацию и заметно ускоряет разработку и запуск. Эти различия отражают и то, как индустрия в целом начинает классифицировать AI-агентов — от automation workflows до reasoning-систем и multi-agent-сетей (см. статью Levels of Autonomy for AI Agents и разбор Types of AI agents от IBM). Это же — фундамент того, как архитектурно устроены мегапопулярные OpenClaw и Claude Code.

Если ты сейчас смотришь в бэклог агентских идей и пытаешься понять, что строить первым, вот что у тебя будет к концу поста:

5-минутный triage-процесс — чтобы отнести любую агентскую идею к одному из трёх архитектурных типов
Гайд по подбору инструмента/платформы под твой проект (когда брать n8n vs LangGraph vs ADK)
Метрики успеха и ROI-фреймворки, заточенные под каждый архитектурный тип
Сигналы тревоги, что ты выбрал не тот путь (и как это чинить)

Ты сможешь посмотреть на свой бэклог и понять: какие идеи отгружаются за шесть недель и дают быстрый ROI, какие требуют три месяца, но двинут выручку, а какие — полугодовая ставка, которая имеет смысл только при правильных ресурсах и правильно выставленных ожиданиях.

И всё это — начиная с признания того, что «агент» — это зонтичный термин для очень разных систем.

Три категории агентов

Каждая «агентская» идея попадает в одну из трёх архитектурных категорий.

**Category 1: Deterministic automation (детерминированная автоматизация)
**Ты определяешь весь флоу. AI делает контент на конкретных шагах. Пример: n8n или Zapier-воркфлоу с LLM-нодами. Сюда попадает большинство агентских возможностей, и с этого большинству команд стоит начинать. Такие проекты быстрее запускаются и приносят измеримый ROI быстрее всех.

**Category 2: Reasoning and acting agents (агенты с рассуждением и действием)
**AI сам решает, что делать дальше, используя доступные инструменты. Пример: Cursor, Lovable или агенты, собранные на LangGraph, CrewAI, Google ADK и т.п. Обычно такие инициативы идут после Category 1 — когда более ценные задачи требуют гибкости и динамического принятия решений, которых воркфлоу не вывозит.

**Category 3: Multi-agent networks (сети из нескольких агентов)
**Несколько специализированных агентов координируются между собой. Пример: enterprise-системы на ADK или AutoGen. Такие проекты обычно приберегают на потом — когда нужно согласовывать работу нескольких команд по доменам, и почти никогда не должны быть стартовой точкой в roadmap.

Несколько примеров «агентов» по категориям, чтобы разница стала нагляднее:

Организации часто пытаются решать Category 1-задачи на Category 2-фреймворках — over-engineering, лишняя сложность и расходы. Реже, но с худшими последствиями, пытаются решать Category 2-задачи инструментами Category 1 — в проде такое ломается, потому что инструмент не тянет.

Разберём каждую категорию подробнее — начнём с рабочей лошадки, Category 1.

Category 1: Deterministic automation

Что это такое

Это воркфлоу, где ты сам определяешь каждый шаг, каждую ветку, каждую точку принятия решения. LLM на конкретных нодах делает понимание естественного языка и генерацию — но флоу контролируешь ты. Думай о них как об «умных блок-схемах»: путь рисуешь ты, контент делает AI.

Самые частые инструменты для детерминированной автоматизации: n8n, Zapier, Make.com, OpenAI AgentKit, Lindy, Gumloop. Они построены вокруг явных триггеров и заранее определённой логики ветвления. Ты задаёшь воркфлоу, а LLM занимается только классификацией, извлечением или драфтингом внутри этих границ.

Как приоритизировать Category 1

Если в бэклоге смесь агентских идей, Category 1-проекты почти всегда — самая умная отправная точка. Такие инициативы проще всего спланировать и сопряжены с наименьшим риском.

Они лучше всего подходят, когда процесс уже хорошо описан, а цель — автоматизировать повторяющуюся, объёмную работу. Если нужен быстрый, измеримый ROI, ограничена AI-инженерная мощность или на тебя давят с результатами в неделях, а не месяцах — Category 1 почти всегда правильная отправная точка.

Большинство инициатив в этой категории имеют схожий профиль по ряду критериев:

Именно это сочетание — быстрые сроки, скромные ресурсы, понятный бизнес-эффект — делает Category 1-инициативы сильными «ранними победами». Они приносят ценность сразу и параллельно накапливают уверенность в организации для более сложных усилий потом.

Какие продукты попадают в эту категорию

Если ты можешь нарисовать весь процесс как блок-схему с понятными точками решения — продукт относится к Category 1. Ещё признаки Category 1:

Пути исполнения конечны и предсказуемы (меньше 15-20 веток)
Задачу надо завершить за секунды-минуты
Ценность — в автоматизации известного процесса, а не в поиске новых подходов

По нашему опыту с клиентами, это покрывает 60-70% агентских возможностей. Возвращаясь к типичному списку, вот отличный пример Category 1-продукта: «Нам нужен AI-агент, который принимает входящие письма от клиентов, читает их, понимает запрос, тянет релевантную информацию из документации, составляет черновик ответа и отправляет на апрув команде».

На первый взгляд — кажется, нужен сложный reasoning. Но когда распишешь, что реально должно произойти, всё оказывается удивительно детерминированным:

Каждый шаг предсказуем. «Интеллект» нужен для того, чтобы понять письмо и сгенерировать хороший ответ, а не чтобы решать, что делать дальше. Это Category 1.

Отличных примеров automation-агентов — куча; вот один мой собственный.

Я люблю Airbnb, но терпеть не могу часами искать лучшие варианты. Поэтому собрал агента, который возьмёт мой точный запрос типа «Современная квартира в Париже рядом с вокзалами с 20 по 26 марта. Для пары» (им уже воспользовались более 10 000 человек) и сам прогонит поиск. Вот как собрать такого же.

Другие примеры Category 1-«агентов»:

агент для планирования путешествий
голосовой книжный компаньон
агент контент-автоматизации (YouTube → LinkedIn)
база знаний твоей организации с поиском по интернету (клон Perplexity)
агент, который пишет глубоко проработанные блоги по заданной теме
персональный счётчик калорий — загружаешь фото еды, он трекает потребление за день и рекомендует питание/тренировки

Как оценивать Category 1-продукты

Метрики ниже отвечают на простой вопрос: автоматизировал ли агент правильный процесс — или идею стоит переосмыслить/перекроить?

Детерминированного агента для автоматизации email-ответов можно оценивать так:

Workflow completion rate: % прогонов, которые завершились успешно
Automation rate: % запросов, обработанных без участия человека
Accuracy: точность классификации интента, извлечения данных и маршрутизации
Latency: время от триггера до итогового вывода (P50/P95 если релевантно)
Cost per workflow: суммарная стоимость LLM и API на один завершённый прогон
Error rate: % прогонов, упавших из-за ошибок инструмента, интеграции или системы
Human review rate: % прогонов, где потребовалось ручное одобрение или вмешательство

Вот workflow completion rate из реального Category 1-кейса — email support agent, сделанный SaaS-компанией, с которой мы работали:

Неделя 1: 52% completion rate (много edge cases вскрылось)
Неделя 4: 78% completion rate (допилили логику классификации)
Неделя 8: 87% completion rate (стабильно, production-ready)
Результат: 3 000 support-писем в месяц автоматизированы, 2.5 FTE-часа в день освободились, экономия $18K/мес

Когда метрики стабилизируются и стоимость идёт вниз — воркфлоу делает то, что должен. Если completion остаётся низким или доля ручных вмешательств высокой, значит, задача недостаточно детерминированная для этой категории.

Как понять, что ты перерос Category 1

Ты поймёшь, что нужна другая архитектура, когда:

В твоей блок-схеме уже 30+ узлов и каждую неделю добавляются новые ветки
Клиенты формулируют так, что ты не можешь предвидеть — а расписать все варианты невозможно
Агенту нужно решать какой API или источник знаний использовать по контексту, а не идти предопределённым путём
Разбор расплывчатых запросов требует исследования и адаптации, а не предопределённой декомпозиции
Самые ценные возможности уже не укладываются в предсказуемый воркфлоу
Большинство quick-win процессов уже автоматизированы

Если ты ловишь сразу несколько таких сигналов — задача больше не подходит под детерминированный воркфлоу, и стоит смотреть в сторону Category 2.

Category 2: Reasoning and acting agents (ReAct)

Что это такое

Вместо того чтобы задавать флоу, ты задаёшь доступные инструменты, а LLM автономно решает, что делать дальше. Агент работает в цикле: observe → reason → act → observe result → повторить.

Ключевая характеристика: инструменты контролируешь ты, reasoning — LLM.

Самые частые инструменты для сборки ReAct-агентов: LangGraph, CrewAI, AutoGen и другие orchestration-библиотеки, поддерживающие tool use, память и динамическое планирование.

Как приоритизировать Category 2

Category 2 — это про ситуации, где запросы пользователя расплывчатые, воркфлоу нельзя описать заранее, а реальная ценность — в гибком, контекстном принятии решений. Если нужен агент, который умеет рассуждать через несколько инструментов, вести диалоги или динамически подстраиваться под новые входы — это Category 2.

Category 2-продукты сложнее планировать и несут больший execution-риск, чем Category 1. Большинство инициатив этой категории имеют похожий профиль:

Сочетание более длинных сроков, специализированной экспертизы и более высоких затрат — вот что делает Category 2 мощным, но более требовательным, чем Category 1. Если в бэклоге есть задачи, которые реально требуют reasoning и динамики — приоритизация Category 2 становится критичной. Они открывают кейсы, которые детерминированная автоматизация не тянет, и раскрывают более продвинутые агентские сценарии с высокой отдачей.

Какие продукты попадают в эту категорию

Продукт относится к Category 2, если один и тот же пользовательский запрос может каждый раз запускать разные последовательности действий. То есть путь определяет не ты — его определяет LLM. Это ключевое отличие от Category 1. Ещё признаки Category 2-продукта:

Одна и та же высокоуровневая задача требует разных последовательностей действий в зависимости от входа
У тебя 5-15+ разных capabilities, и какая нужна — зависит от контекста
Интент пользователя расплывчат и требует уточнения через диалог
Несколько модальностей входа (голос, картинка, текст) нужно понимать контекстно
Разбор сложных запросов на под-задачи — и есть часть ценности

В нашей работе с клиентами это правильный выбор для 25-30% агентских возможностей. За примером вернёмся к голосовому шопинг-ассистенту из начала поста.

Клиенты должны уметь искать товары голосом, загружать фото для поиска похожего, проверять статус заказа, обновлять предпочтения, инициировать возвраты — и всё это через разговор.

На первый взгляд — это Category 1. Просто опиши интенты и маршрутизируй, правда? Но в реальности живые разговоры не идут по фиксированным путям. Чтобы понять почему, разберём одно взаимодействие.

Клиент загружает фото ботинок и говорит:
«Эти маловаты. Нужен размер больше, и доставка до четверга».

Вот что происходит под капотом:

Observe. Агент получает смешанный вход: картинка + голосовой запрос.
Reason. Он определяет: сначала — опознать товар на фото; затем — найти доступные варианты размеров; потом — проверить даты доставки; наконец — подтвердить заказ с пользователем.
Act. Агент динамически выбирает инструменты: visual_search() → опознать товар; check_inventory() → найти наличие нужного размера; get_delivery_options() → проверить доставку в четверг; place_order() → после подтверждения.
Observe result → reason again. Ответ каждого инструмента обновляет состояние агента и влияет на следующий шаг.

Эту последовательность нельзя определить заранее.

Если товара нет в наличии, агент может предложить альтернативы.
Если доставки в четверг нет — может предложить самовывоз.
Если картинка не распознаётся — задаст уточняющий вопрос.

Один и тот же запрос запускает разные последовательности действий — в зависимости от того, что решил reasoning-цикл.

Другие примеры Category 2-«агентов»:

диалоговый агент клиентской поддержки
код-ассистент, который правит репозитории, например Claude Code
умный персональный шопинг-ассистент
IT troubleshooting-агент
sales-copilot, который ресёрчит аккаунты и пишет outreach
мультимодальный ассистент с голосом, картинками и текстом

Как оценивать Category 2-продукты

Reasoning-агентов оценивают по тому, помогают ли они пользователям достигать цели на разных путях — оставаясь достаточно эффективными, чтобы оправдать стоимость.

Эти метрики отвечают на вопрос: был ли динамический reasoning необходим — или задачу стоило упростить до более низкой категории?

Task completion rate: % сессий, где пользователь достиг цели
Reasoning accuracy: корректность декомпозиции задачи, выбора инструмента и порядка решений
Conversation length: среднее число реплик до решения
Multimodal accuracy: корректность интерпретации картинок, голоса или структурного ввода (если применимо)
Tool call efficiency: среднее число tool calls на успешную сессию
Latency: время на реплику и end-to-end длительность сессии
Cost per session: суммарная стоимость LLM и API на одно завершённое взаимодействие
User satisfaction: post-interaction CSAT или эквивалентный сигнал
Business impact: прирост конверсии, retention или task success vs baseline

Вот метрики из реального кейса — voice + image шопинг-ассистент для ритейлера товаров для дома, который мы строили:

Месяц 1: 71% task completion, диалоги длиннее, больше tool calls, $0.12 за сессию
Месяц 4: 86% task completion, диалоги короче, меньше tool calls, $0.08 за сессию

Результат: точность распознавания картинок выросла с 76% до 91%, прирост конверсии — с +8% до +22%, CSAT — с 4.0 до 4.5.

Когда task completion растёт, а длина диалога, число tool calls и стоимость сессии падают — reasoning-цикл агента приносит ценность. Если метрики стоят, а цена держится высокой — скорее всего, задача over-scoped или её лучше решить детерминированным подходом Category 1.

Как понять, что ты перерос Category 2

Ты поймёшь, что нужна другая архитектура, когда:

Твой единственный агент тянет слишком много доменов (клиентская поддержка + склад + логистика + финансы) — и деградирует
Нужно, чтобы агенты делегировали задачи друг другу, а не только звали stateless API. Пример: шопинг-агенту нужно спросить inventory-агента: «Проверь все склады и предложи альтернативы»
Задачи занимают часы или дни (вроде автоматического eval-агента, анализирующего 10 000 диалогов за ночь)
Нужны сотни экземпляров агентов параллельно, которые координируют работу между собой
Разные команды хотят владеть своими специализированными агентами, но те должны работать вместе

Если у тебя 2-3 таких сигнала одновременно — пора смотреть в сторону Category 3.

Category 3: Multi-agent network

Что это такое

Вместо одного агента, вызывающего инструменты, у тебя несколько специализированных агентов, которые координируются. Каждым владеет своя команда, каждый ведёт свой домен и может попросить помощи у других агентов.

Ключевая характеристика Category 3: агенты делегируют другим агентам, а не просто API.

Category 2 vs. Category 3 — в чём разница?

Category 2: один шопинг-агент зовёт inventory API, чтобы проверить остатки.
Category 3: шопинг-агент спрашивает Inventory Agent: «Можешь проверить все склады и предложить альтернативы?» → тот, в свою очередь, спрашивает Logistics Agent: «Доставим со склада B до четверга?»

Каждый агент в сети сам по себе — reasoning-система, которая умеет разбирать запрос. Но они координируются, делегируя сложные задачи друг другу, а не пытаясь тащить всё в одном.

На практике шопинг-агенту не обязательно знать, как работает inventory-forecasting — ему достаточно найти и поговорить с Inventory Agent, которым владеет ops-команда. Когда ops прокачают своего агента, шопинг автоматически выиграет.

Для Category 3-проектов можно использовать те же фреймворки, что и для одиночных reasoning-агентов, но их нужно дополнить слоями координации: например, Google A2A-протоколом для структурированного agent-to-agent делегирования и enterprise-оркестраторами вроде Temporal, Kafka или Step Functions — для discovery, маршрутизации и длительных workflow.

Как приоритизировать Category 3

Category 3 почти никогда не бывает отправной точкой в roadmap. Она становится актуальной, только когда организация уже гоняет в проде несколько агентов и они должны работать вместе.

Дело в том, что Category 3 — самый сложный и ресурсоёмкий тип агентской работы. Типичный проект тут включает:

Большинству организаций стоит инвестировать в Category 3 только после успехов в Category 1 и Category 2. Один orchestrator-агент (Category 2) обычно проще и эффективнее — пока реальная кросс-командная координация не станет неизбежной.

Какие продукты попадают в эту категорию

Признаки Category 3-продуктов:

Несколько команд должны строить и владеть специализированными агентами
Агенты должны работать асинхронно часами или днями
Ни один агент в одиночку не тянет требуемую широту capabilities
Система должна масштабироваться на сотни параллельных экземпляров
Новых агентов нужно добавлять без передеплоя всего

Multi-agent-сети пока редкость — их делают меньше 5-10% команд, строящих агентов. Мы ожидаем, что в ближайшие 12-24 месяца adoption вырастет: всё больше компаний получат несколько команд, независимо разворачивающих production-агентов, и координация станет неизбежной.

Мы уже начали видеть, как multi-agent-сети появляются у Fortune 500-ритейлеров и сетей питания в США, с которыми работаем. У них есть отдельные команды, которые хотят строить специализированных агентов для:

Клиентского сервиса (возвраты, запросы, статус заказа)
Помощи в покупках (поиск товаров, рекомендации)
Управления остатками (проверка стока, дозаказ)
Координации логистики (график доставки, оптимизация маршрутов)
Мониторинга качества (eval-агент, наблюдающий за всеми остальными)

Но эти агенты должны работать вместе, чтобы решать важные сценарии:

Шопинг-агент видит, что клиенту нужно что-то, чего нет в наличии → делегирует inventory-агенту проверить другие локации
Inventory-агент видит регулярные стокауты → делегирует logistics-агенту подстроить график дозаказов
Customer service-агент замечает всплеск жалоб → делегирует quality-агенту расследовать
Quality-агент находит проблему с шопинг-агентом → репортит в систему мониторинга

Ни одна команда не построит всё это в одиночку. Каждому агенту нужно развиваться независимо. Но им нужно координироваться, чтобы закрывать продуктовые возможности.

Это Category 3.

Как оценивать Category 3-продукты

Category 3-системы успешны, если много независимых агентов умеют работать вместе, не создавая хрупкости. Для оценки лучше фокусироваться на пяти сигналах:

Agent uptime: % времени, когда каждый агент доступен
Cross-agent success rate: % multi-agent-коллабораций, завершившихся успешно
Discovery success rate: % lookup'ов агентов, нашедших правильного
End-to-end latency: P50, P95, P99 для задач, требующих нескольких агентов
Cost per complex task: сумма всех LLM-вызовов всех агентов
Team velocity: время на добавление нового агента или capability

Вот как Category 3-метрики сработали в реальном кейсе — крупный ритейлер развернул multi-agent-сеть на customer service, inventory, logistics и quality monitoring:

Ранний деплой: agent uptime 97-98% на агента; cross-agent success rate 72% успешных multi-agent workflow'ов; discovery success rate 81% правильной маршрутизации; end-to-end latency P50 1.8с, P95 6.4с, P99 14.2с; cost per complex task $1.85; team velocity 6-8 недель на нового агента.
Стабильный деплой: agent uptime >99.5% на агента; cross-agent success rate 91%; discovery success rate 94%; end-to-end latency P50 1.6с, P95 4.9с, P99 7.8с; cost per complex task $1.92 (стабильно, несмотря на рост числа агентов); team velocity 2-3 недели на нового агента.

Результат: новых агентов и команды добавляли без деградации надёжности, хвостов латентности и стоимости задачи.

Когда cross-agent success rate и перцентили латентности держатся стабильно при добавлении новых агентов, а стоимость сложной задачи растёт медленно или стоит на месте — multi-agent-сеть оправдана для этого продукта. Если с каждым новым агентом взлетают failure rate, хвосты латентности или время интеграции — скорее всего, система перекоординирована или преждевременно усложнена. Смотри в сторону Category 1 или Category 2.

Фреймворк принятия решений: как выбрать категорию

Вот систематический процесс, как понять, какая категория нужна твоей агентской возможности.

5-минутный triage

Для каждой агентской идеи в бэклоге задай эти вопросы:

Что если выбрал не ту категорию?

На практике не все команды попадают с первого раза — и это нормально. Цель triage — не гарантировать идеальное решение в день первый. Цель — помочь тебе сделать лучшую стартовую ставку с имеющейся информацией и быстро скорректироваться по сигналам из реальной жизни.

Если ты стартовал не в той категории, сигналы обычно приходят быстро:

Category 1-проект, у которого всё растут ветки и edge cases, — скорее всего, Category 2-задача
Category 2-агент, который в основном идёт по фиксированным паттернам, — вероятно, был бы проще и дешевле как Category 1
Category 3-дизайн, который требует тяжёлой координации ради маленького прироста, — обычно лучше упростить до Category 2

Ключевое — относиться к категоризации как к живому решению, а не как к постоянному ярлыку. Пилотируй рано, мерь честно и будь готов рефакторить архитектуру, если доказательства ведут в другую сторону. Выбор «не той» категории на несколько недель стоит куда дешевле, чем вообще не иметь фреймворка.

Реальные системы: где архитектуры сходятся

В реальности production-агентские системы редко придерживаются одной парадигмы. Два самых часто разбираемых примера — OpenClaw и Claude Code.

OpenClaw — в первую очередь ReAct-агент. Он крутит непрерывный цикл reasoning → выбор инструмента → действие — в мессенджерах вроде WhatsApp и Telegram. Но пользователь может сконфигурировать несколько специализированных агентов, которые координируются на сложных задачах — и тогда это уходит в multi-agent-зону, если задача требует.

Claude Code идёт дальше. В его ядре — ReAct reasoning loop: модель решает, что делать, зовёт инструмент, смотрит результат и продолжает. Поверх — детерминированная система хуков, которая запускает скрипты на событиях жизненного цикла (сохранение файла, shell-команда) — без участия LLM вообще. А когда задача слишком большая или рискованная для одного контекст-окна, он порождает sub-агентов с изолированными контекстами, которые координируются через структурированный approval-паттерн.

Ни одна из этих систем не является ни чисто детерминированной, ни чисто ReAct, ни чисто multi-agent. Они слоёные — каждая парадигма закрывает конкретный режим отказа, который другие не вывозят. Детерминированный слой — для аудируемости. ReAct — для гибкого reasoning. Multi-agent — для параллельности и изоляции.

Вот настоящее дизайн-решение: не «какую архитектуру выбрать», а «когда текущий слой перестал справляться — и пора подключать следующий».

Путь вперёд

Этот фреймворк — не единственный способ думать про агентские архитектуры. Но он себя оправдал для команд, у которых в бэклоге лежит список «агентских» идей, и они пытаются понять, что строить первым и как выстраивать инвестиции.

Главный инсайт: не все агенты одинаковы. Детерминированная автоматизация, reasoning-агент и multi-agent-сеть требуют совершенно разных архитектур, сроков, бюджетов и экспертизы. Относиться к ним одинаково — именно поэтому столько инициатив стопорится, а приоритизация кажется невозможной.

Вот где категоризация становится инструментом roadmap. Как только идеи разложены по категориям, приоритизация следует сама:

Category 1-инициативы быстрее всего запускаются и приносят ROI — поэтому это лучшая отправная точка
Category 2-инициативы идут следом — когда более ценные задачи требуют reasoning и гибкости
Category 3-инициативы приберегают для ситуаций, где кросс-командная координация реально необходима

Другими словами, категории задают порядок: стартуй просто, докажи ценность и наращивай сложность только если задача того требует.

Команды, которые успешно отгружают агентские системы, — это те, кто умеет быстро определять категорию задачи и сопротивляется соблазну переусложнять.

Три вопроса для каждой агентской идеи:

Какую категорию эта задача реально требует? (Используй 5-минутный triage.)
Есть ли у нас инфраструктура и экспертиза под эту категорию? (Будь честен про готовность.)
Каков измеримый ROI и как мы поймём, что работает? (Определи метрики успеха до сборки.)

Если ты не можешь чётко ответить на все три — ты не готов начинать стройку. И это нормально. Лучше стартовать с Category 1-автоматизации, которая отгрузится за шесть недель и даст измеримую ценность, чем запустить Category 3-multi-agent, который «на 90% готов» спустя полгода.

Вот так этот фреймворк помогает с приоритизацией: он превращает запутанный список «агентов» в чёткую практическую последовательность — что строить сейчас, что дальше, а что оставить на потом.

Спасибо, Hamza и Jaya!

Продуктивной и осмысленной недели 🙏

Если рассылка полезна — поделись с другом и подпишись, если ещё не. Доступны групповые скидки, подарки и реферальные бонусы.

Искренне твой,

Lenny 👋