site / audit
Матрица функциональной регрессии
Exhaustive матрица: список ВСЕХ интерактивных функций × текущий статус (pass / partial / fail / not tested) × cross-browser/device. Не выборка — система.
auditregressionqa
Открыть
Средний60-120 мин (первый прогон), 30 мин (последующие)
agents / evals
Регрессионный тест-сет
Каждый баг — новый тест. Дискаверь регрессии до прода.
evalsregressiontesting
Открыть
Начальный15-30 мин
agents / evals
Eval-набор для агентов с CI
Набор задач, метрики качества, regression-detection, интеграция с CI — каждый PR с промтом проходит через эвалы.
evalsagentsci
Открыть
Продвинутый1-2 часа
agents / evals
Курация golden dataset для evals
Собрать golden dataset: что включить (happy path, edge cases, regression, antagonistic), как версионировать через git, метрики (accuracy, latency, cost), как обновлять без подгонки.
evalsdatasetgolden
Открыть
Продвинутый1-2 часа
code / debuggingFeatured
Systematic Debugging Orchestrator: 6 фаз от симптома до root cause
Дисциплинированный процесс отладки: симптомы → минимальная репрезентация → дерево гипотез → trace/bisect → root cause → fix + regression test. Iron Law: никаких фиксов без root cause.
debuggingroot-causesystematic
Открыть
Продвинутый2-4 часа