Skip to content
PПромтбук
RUEN
На главную
07Разделы

Данные

Промты для работы с данными: SQL, моделирование, пайплайны, аналитика.

20промтов в разделе
Подразделы

Промты для работы с данными: SQL, моделирование, пайплайны, аналитика.

Сложность
  • Начальный0 (0%)
  • Средний6 (30%)
  • Продвинутый14 (70%)
Все промты

Все промты в разделе Данные

Featured

Оптимизация медленного SQL по EXPLAIN ANALYZE

Систематическое чтение плана: где врёт оптимизатор, почему seq scan вместо index, как починить join order.

sqlperformanceexplain
Продвинутый30-60 мин

Оконные функции: паттерны и подводные камни

PARTITION BY, ROWS vs RANGE, running totals, ranking, sessionization, gap detection. С подсказками по производительности.

sqlwindow-functionsanalytics
Средний30-60 мин

Рекурсивные CTE: иерархии и графы

Org chart, BOM, graph traversal. Termination, cycle detection, когда лучше materialized path или nested set.

sqlcterecursion
Продвинутый30-60 мин

Диагностика медленных запросов (pg_stat_statements)

С чего начать когда «база тормозит»: top offenders, lock contention, stale stats, parameter sniffing.

sqlpostgresdiagnostics
Продвинутый30-60 мин

Dimensional modeling по Кимбаллу: факты и измерения

Звезда vs снежинка, типы факт-таблиц, conformed/role-playing/junk-измерения, выбор грануляции и где ломаются новички.

modelingkimballwarehouse
Продвинутый1-2 часа

Slowly Changing Dimensions: Type 1/2/3/6 без боли

Когда что выбирать, что считается «изменением», как влияет на запросы и размер БД, и как мигрировать без переписывания витрин.

modelingscdhistory
Продвинутый30-60 мин

3NF vs star vs One Big Table: когда что выбирать

Trade-offs read perf / write complexity / storage для OLTP, OLAP и аналитики. Как мигрировать между моделями без переписывания клиентов.

modelingnormalizationdenormalization
Средний30-60 мин

Data contracts: producer ↔ consumer без сюрпризов

Schema versioning, политика breaking changes, валидация в pipeline, choice block vs warn, Avro/Protobuf/JSON Schema на практике.

modelingcontractsschema
Продвинутый30-60 мин

Online schema migration без даунтайма

Expand/contract, backfill, dual writes, lock-free DDL (pg_repack, gh-ost), стратегии отката и мониторинг прогресса.

modelingmigrationddl
Продвинутый1-2 часа

Проектирование ELT-пайплайна: extract → load raw → transform

Идемпотентность, staging vs marts, инкрементальная загрузка vs full refresh, dbt-стиль трансформаций и freshness SLA.

eltpipelinedbt
Продвинутый1-2 часа

Дизайн DAG'ов в Airflow без боли

Дробление tasks, dependencies, retries, SLA, sensors vs polling, как не сделать DAG-of-doom и когда смотреть на Prefect/Dagster.

airfloworchestrationdag
Продвинутый1-2 часа

Data quality checks: schema, nullness, freshness, business rules

Где запускать (input/output/cross), fail vs warn, метрики для дашборда, как не превратить тесты в боль.

data-qualitydbt-testsgreat-expectations
Средний30-60 мин

Стратегия бекфилла: chunking, throttling, rollback

Когда нужен бекфилл, требования к идемпотентности, чанкование по дням/часам, не положить прод БД, мониторинг прогресса.

backfillidempotencythrottling
Продвинутый30-60 мин

Observability data-пайплайнов: latency, throughput, lineage, SLO

Что мерить на каждой стадии, lineage через OpenLineage/Marquez, SLO для свежести, как алертить без шума.

observabilitylineageopenlineage
Продвинутый1-2 часа
Featured

Когортный анализ end-to-end: от вопроса до плана действий

Шесть фаз: формулировка вопроса, определение когорты, SQL, визуализация, интерпретация, план действий. С heatmap, retention curve, сегментацией и приоритизацией N.

cohortretentionanalytics
Продвинутый1-2 часа

Дизайн модели атрибуции маркетинговых каналов

First-touch / last-touch / linear / time-decay / position-based / data-driven: когда какую выбрать, ограничения, как мерить эффект, multi-touch vs single-touch, online vs offline.

attributionmarketinganalytics
Средний30-60 мин

Anomaly detection для бизнес-метрик: пайплайн от детекции до RCA

Static thresholds vs adaptive (rolling z-score, ESD, Prophet), контроль false positives, сезонность, alert tiering, flow расследования.

anomalymonitoringalerts
Продвинутый30-60 мин

Funnel analysis deep dive: события, окна, сегменты, ловушки

Step definition (events vs pageviews), time windows, cohort comparison, интерпретация drop-off (UX vs intent), segment-aware funnels, как избежать vanity funnel.

funnelconversionanalytics
Средний30-60 мин

Information architecture дашборда: hero, comparison, trends, breakdowns

Hero metric, comparison, trends, breakdowns, alerts. Иерархия overview → drill-down, что НЕ класть, обновляемость, audience-aware (exec vs ops).

dashboarddesignanalytics
Средний30-60 мин

Customer Data Platform: дизайн с нуля

Дизайн CDP: identity resolution, schemas (events vs profiles vs traits), real-time vs batch, активация в инструменты (email/ads/CS), governance и compliance.

cdpdataidentity
Продвинутыйдень+ (на дизайн, импл — months)