Агент пишет код за минуты — а потом ты часами перепроверяешь, правда ли он сделал то, что говорит. По опросу Sonar, 96% разработчиков не доверяют AI-коду полностью — не уверены, что он функционально корректен. Planner закрывает этот разрыв: агент доказывает каждый критерий, независимый судья проверяет — «готово» значит проверено, а не рассказано.
Посмотреть, как это работает →Интерактивное демо — без регистрации
Генерация подешевела до нуля. Проверка — нет. 61% разработчиков говорят, что AI часто выдаёт код, который выглядит правильным, но ненадёжен; 38% — что ревью AI-кода требует больше усилий, чем ревью кода живого коллеги. CTO AWS Вернер Фогельс назвал это verification debt: долг проверки, который ты выплачиваешь руками после каждого «готово».
Источники: Sonar — State of Code Developer Survey (96%, 61%, 38%) · IT Pro — «verification debt», Werner Vogels (AWS re:Invent)
Тесты зелёные — но проверяют заглушку, а не поведение. Функция, которую ты просил, осталась TODO под аккуратным отчётом о проделанной работе. Агент генерит слова о завершении тем же движком, что и код — независимо от того, что реально на диске. И доказывает работу, и принимает её одно лицо. Независимой проверки в контуре нет.
Planner ставит между «агент сказал» и «задача закрыта» проверяемый контур из четырёх шагов:
Проверяемыми над результатом, а не «на словах». Что именно должно стать правдой, чтобы задача считалась закрытой.
Агент получает не расплывчатую просьбу, а цель с явными критериями — и знает, по чему его закрытие будут проверять.
Артефакты результата — а не отчёт о проделанной работе.
→ доказывает агентОтдельная сессия без доступа к рассуждениям агента — судит по приложенным артефактам, а не по его отчёту. Содержательно сопоставляет evidence с критерием и засчитывает закрытие или отклоняет с причиной.
→ проверяет судьяДоказывает агент. Проверяет — судья. «Готово» перестаёт быть словом агента и становится проверенным фактом — без verification debt, который ты выплачивал руками.
С живого прогона демо. Агент отчитался, что шаг онбординга сделан, и приложил скриншот как доказательство. Судья вынес вердикт по самому скриншоту — а не по отчёту.
Каждый вердикт цитирует пруф, на котором стоит. Перепроверь сам.
Та отклонённая карточка — итерация 1. Здесь тот же критерий онбординга прогоняется через петлю снова и снова — каждую попытку судят по видимому результату, и счётчик выполненных условий двигается только в одну сторону.
Пять попыток, один критерий — счётчик выполненных условий ни разу не идёт назад. Этот храповик и есть суть: каждое засчитанное «готово» пришлось заслужить перед evidence.
Агент скажет, что всё готово. Коммиты сделаны, тесты проходят. Открываешь ветку — а там половина хелпера, ни одного теста и билд, который не собирается.— Brad Kinnard, «AI coding agents lie about their work» (перевод)
Задайте критерии один раз — и пусть агент доказывает, а судья проверяет. Посмотрите на готовом примере, как «готово» становится проверенным.
Ранний доступ. Planner собран в собственной разработке и каждую свою задачу проводит тем же контуром — пример на демо настоящий, не нарисованный.
Посмотреть, как это работает →Интерактивное демо — без регистрации · готовы подключить? Подключить к Claude →