Лестница вайбкодинга: простой пошаговый гайд
Пока мы все в бесконечном шторме новостей про LLM, я решил в очередной раз попытаться помочь коллегам сориентироваться. Сейчас почти каждый из нас в той или иной мере представляет, как работают LLM и всё равно в какой-то момент мы натыкаемся на пробел в знаниях, о существовании которого даже не подозревали.
Чтобы это закрыть, я собрал своего рода “лестницу уровней” — тот онбординг в вайбкодинг, который я хотел бы получить сам. Между уровнями внимательный читатель может найти ответы на косвенные вопросы, типа зачем строить собственные инструменты, если можно остаться в «ретейле», где начинается оверинжиниринг и т.п.
СТАДИЯ I — Учимся доверять агенту
Уровень 0. Вы пользуетесь чатом — вы спрашиваете, он отвечает. Это ассистент: он говорит, действуете вы. Подавляющее большинство пользователей LLM находится именно здесь. Это важно понимать, потому что именно под это большинство компании (OpenAI, Anthropic, и им подобные) и строят свои фичи.
Уровень 1. Вы включили bypass-режим и позволили агенту самому выполнять команды. Именно здесь ваш чатбот стал агентом — потому что агентность это действие, а не настройка.
Уровень 2. Вы нашли CLAUDE.md — постоянные инструкции, которые ваш агент читает каждый раз, но вы практически не трогаете этот файл, так что агент работает на том, что нахватал из разговоров с вами.
Уровень 3. Вы начинаете наладку CLAUDE.md и в какой-то момент упираетесь в context rot, когда раздувшийся файл делает модель тупее и она начинает галлюцинировать; важный урок — держать этот файл компактным, потому что агент честен ровно настолько, насколько чист его контекст. Заодно вы усваиваете правило держать CLAUDE.md в пределах 200 строк.
Уровень 4. Вы перестаёте гадать и пишете EVAL-ы — небольшие тесты, которые доказывают, что результат работы вашего агента действительно работает. Сюда входят оценки по шкале 1–10 в ответах, сборка бенчмарков, настройка definition of done и другие методы. Этот шаг почти все пропускают, однако именно здесь вы начинаете измерять вместо того, чтобы надеяться. Этот шаг критический, потому что здесь вы создаете своего Judge-агента — своего рода “судью” который по вашей методологии определяет правильнойсть результата работы вашего агента. Это может быть агент QA или, как у меня, The Order.
Уровень 5. Вы узнаёте, что CLAUDE.md файлов на самом деле два — глобальный для того, кем агент является всегда, и проектный для того, что нужно конкретному репозиторию. И что ваше «держи CLAUDE.md меньше 200 строк» подразумевает, что глобальный и локальный файлы СУММАРНО должны укладываться в эти 200 строк.
СТАДИЯ II — Выводим себя из петли
Здесь важно понять, что параллельно у ваших агентов развиваются и “разум” и “руки”: разум агента — память, контекст, суждение; руки – инструменты, до которых он дотягивается через MCP, shell, web и API.
Уровень 6. Один агент упирается в потолок (те самые ~200 строк глобального и локального CLAUDE.md вместе), и вы уходите в мультиагентность, делегируя часть работы основного агента другому. Вы сразу чувствуете цену — сложность делегирования, дрейф контекста — пока не научитесь дробить эти файлы только тогда, когда работа реально не влезает в один разум. Здесь мы говорим о большой работе с семантикой, когерентностью и компактностью правил в ваших claude.md.
Уровень 7. Вы находите MEMORY.md — память, которая переживает сессии и расшаривается между агентами, так что работа накапливается, а «умный в моменте» превращается в «умный со временем». С этого момента у вас настоящая оркестрация: несколько агентов, общая память и Judge-агент, который гоняет ваши EVAL-ы и обеспечивает качество результата. По сути вы уже управляете маленькой tech компанией.
Уровень 8. В какой-то момент вы сносите половину построенного ради оптимизации. Вы усвоили, что лёгким ядром проще управлять и, что важнее, ему проще доверять. Вы понимаете, что автономность — это не про количество агентов, а про качество инструкций и контроля исполнения команд.
Уровень 9. Вы сделали протокол онбординга, и теперь ваши агенты начинают звать друг друга, а не вас: оркестратор выбирает, кого разбудить, передаёт задачи и собирает результаты — вы вот-вот выйдете из большинства мелких и средних мультиагентных операций.
Уровень 10. Ваши агенты научились рассуждать вместе — один пишет черновик, Judge давит в ответ, тот переделывает, и всё это устаканивается против ваших EVAL-ов, оставляя вас в петле только на наиболее чувствительных решениях.
Уровень 11. Ваши агенты работают сами. Ваша ежедневная рутина — проснуться, посмотреть, что они построили за ночь, убедиться, что вы и ваши агенты усвоили подводные камни и прочие «gotchas». Потом вы собираете следующую пачку задач. По сути большая часть вашего времени уходит на то, чтобы собрать задачу так, чтобы она идеально легла в вашу мультиагентную среду и они выдали вам отличный результат по итогу.
СТАДИЯ III — Перейти границы дисциплин
Уровень 12. (Сильно спекулятивно. Я сам сюда еще не добрался.) Вы строите несколько «департаментов» агентов, ограничивая их в рамках одной дисциплины. У вас есть маркетинг, BD, разработка с программистами и QA и так далее. У всех свои judge-агенты, все следуют протоколу, все знают друг о друге. Вы вот-вот заведёте Product Manager-а, который сможет собирать вам целые проекты за ночь, используя ресурсы ваших отделов.
Уровень 13. ??? Не сейчас, но скоро.
Зачем вообще “подниматься” по этой лестнице?
Всё, что большие корпорации — будь то OpenAI, Anthropic и прочие — выдают вам из коробки, построено под среднего пользователя, потому что средний пользователь — единственное, подо что вообще можно строить массовый продукт. Вам не отгружают потолок возможного — вам отгружают безопасную середину, которая достаточно хорошо работает для миллионов людей, каждый из которых хочет чего-то чуть-чуть своего. Я не из тех, кто видит заговоры. Я говорю это потому, что как продакт-менеджер, который больше десяти лет строил high-impact продукты, я знаю корень этих бизнес-решений.
И всё же — дефолтное окно чата (Уровень 0) это норма, но настоящий leverage живёт не там.
Каждый уровень на этой лестнице — шаг от дефолта. То, как я вижу реальность сейчас, это два варианта развития вашей карьеры.
- Можно быть пользователем LLM — вы логинитесь, печатаете, получаете те же ответы, что и все, и рынок оценивает вас соответственно, как человека, умеющего пользоваться инструментом. Ваш потолок — это потолок инструмента. Вы арендуете чужой интеллект по часам, и вас ровно так и оценивают.
- Можно слезть с ретейл инструментария и стать tech-компанией из одного человека, владеющей памятью, агентами, эвалами, оркестрацией и инструментами, в которые они воткнуты. Вся машина едет по рельсам, которые вы проложили, и работает, пока вы спите. В этот момент вы перестаёте арендовать интеллект и начинаете им владеть — у вас появляется IP, появляется leverage, и ваша ценность перестаёт зависеть от того, сколько вы успеваете напечатать за час, и начинает расти на том, что вы построили. При этом я не столько говорю о самих продуктах которые вы строите, сколько о механизме оркестрации, качестве ваших Judge агентов, качестве вашего “департамента маркетинга” и так далее.
Ритейл (розница) вам этого никогда не даст. Это просто не имеет смысла. Да и с другой стороны, если так посмотреть, материала под это дело (создание своей мини-компании) - пруд пруди. Просто у большинства из нас нет достаточно дисциплины и curiosity под это дело.
Большинство из вас ничего не поменяет в своей рутине. Немногие поменяют — и я надеюсь, этот текст поможет вам стать сильнее.
Wolf Alexanyan, Ереван, Армения, июнь 2026.


