Данные
Промты для работы с данными: SQL, моделирование, пайплайны, аналитика.
Промты для работы с данными: SQL, моделирование, пайплайны, аналитика.
- Начальный0 (0%)
- Средний6 (30%)
- Продвинутый14 (70%)
SQL
Запросы, оптимизация, window functions, recursive CTE, диагностика.
Моделирование
Dimensional modeling, нормализация, schema migration, data contracts.
Пайплайны
ELT, оркестрация, data quality, бекфилл, observability пайплайнов.
Аналитика
Когортный анализ, атрибуция, аномалии, воронки, дашборды.
Все промты в разделе Данные
Оптимизация медленного SQL по EXPLAIN ANALYZE
Систематическое чтение плана: где врёт оптимизатор, почему seq scan вместо index, как починить join order.
Оконные функции: паттерны и подводные камни
PARTITION BY, ROWS vs RANGE, running totals, ranking, sessionization, gap detection. С подсказками по производительности.
Рекурсивные CTE: иерархии и графы
Org chart, BOM, graph traversal. Termination, cycle detection, когда лучше materialized path или nested set.
Диагностика медленных запросов (pg_stat_statements)
С чего начать когда «база тормозит»: top offenders, lock contention, stale stats, parameter sniffing.
Dimensional modeling по Кимбаллу: факты и измерения
Звезда vs снежинка, типы факт-таблиц, conformed/role-playing/junk-измерения, выбор грануляции и где ломаются новички.
Slowly Changing Dimensions: Type 1/2/3/6 без боли
Когда что выбирать, что считается «изменением», как влияет на запросы и размер БД, и как мигрировать без переписывания витрин.
3NF vs star vs One Big Table: когда что выбирать
Trade-offs read perf / write complexity / storage для OLTP, OLAP и аналитики. Как мигрировать между моделями без переписывания клиентов.
Data contracts: producer ↔ consumer без сюрпризов
Schema versioning, политика breaking changes, валидация в pipeline, choice block vs warn, Avro/Protobuf/JSON Schema на практике.
Online schema migration без даунтайма
Expand/contract, backfill, dual writes, lock-free DDL (pg_repack, gh-ost), стратегии отката и мониторинг прогресса.
Проектирование ELT-пайплайна: extract → load raw → transform
Идемпотентность, staging vs marts, инкрементальная загрузка vs full refresh, dbt-стиль трансформаций и freshness SLA.
Дизайн DAG'ов в Airflow без боли
Дробление tasks, dependencies, retries, SLA, sensors vs polling, как не сделать DAG-of-doom и когда смотреть на Prefect/Dagster.
Data quality checks: schema, nullness, freshness, business rules
Где запускать (input/output/cross), fail vs warn, метрики для дашборда, как не превратить тесты в боль.
Стратегия бекфилла: chunking, throttling, rollback
Когда нужен бекфилл, требования к идемпотентности, чанкование по дням/часам, не положить прод БД, мониторинг прогресса.
Observability data-пайплайнов: latency, throughput, lineage, SLO
Что мерить на каждой стадии, lineage через OpenLineage/Marquez, SLO для свежести, как алертить без шума.
Когортный анализ end-to-end: от вопроса до плана действий
Шесть фаз: формулировка вопроса, определение когорты, SQL, визуализация, интерпретация, план действий. С heatmap, retention curve, сегментацией и приоритизацией N.
Дизайн модели атрибуции маркетинговых каналов
First-touch / last-touch / linear / time-decay / position-based / data-driven: когда какую выбрать, ограничения, как мерить эффект, multi-touch vs single-touch, online vs offline.
Anomaly detection для бизнес-метрик: пайплайн от детекции до RCA
Static thresholds vs adaptive (rolling z-score, ESD, Prophet), контроль false positives, сезонность, alert tiering, flow расследования.
Funnel analysis deep dive: события, окна, сегменты, ловушки
Step definition (events vs pageviews), time windows, cohort comparison, интерпретация drop-off (UX vs intent), segment-aware funnels, как избежать vanity funnel.
Information architecture дашборда: hero, comparison, trends, breakdowns
Hero metric, comparison, trends, breakdowns, alerts. Иерархия overview → drill-down, что НЕ класть, обновляемость, audience-aware (exec vs ops).
Customer Data Platform: дизайн с нуля
Дизайн CDP: identity resolution, schemas (events vs profiles vs traits), real-time vs batch, активация в инструменты (email/ads/CS), governance и compliance.