Перейти к содержанию

Справочник spec DataFlow

Описание полей DataFlow spec. Оркестрация (Deployment, реконсиляция, status) — в Жизненный цикл и status.

Структура CRD

flowchart TB
  subgraph DataFlow["DataFlow"]
    Spec["spec"]
    Status["status"]
  end

  subgraph SpecFields["поля spec"]
    Source["source (обязательно)"]
    Sink["sink (обязательно)"]
    Trans["transformations (опционально)"]
    Errors["errors (опционально)"]
    Resources["resources (опционально)"]
    Scheduling["scheduling (опционально)"]
    Checkpoint["checkpointPersistence (опционально)"]
    ChannelBuffer["channelBufferSize (опционально)"]
    Replicas["replicas (опционально, Kafka)"]
    Image["processorImage / processorVersion (опционально)"]
  end

  Source --> SourceTypes["type: kafka | postgresql | trino | clickhouse | nessie"]
  Sink --> SinkTypes["type: kafka | postgresql | trino | clickhouse | nessie"]
  Trans --> TransTypes["timestamp | flatten | filter | mask | router | select | remove | snakeCase | camelCase"]

  Spec --> Source
  Spec --> Sink
  Spec --> Trans
  Spec --> Errors
  Spec --> Resources
  Spec --> Scheduling
  Spec --> Checkpoint
  Spec --> ChannelBuffer
  Spec --> Replicas
  Spec --> Image

Поля spec

Поле Обязательность Описание
source Да Тип и конфигурация источника. См. Коннекторы.
sink Да Основной приёмник.
transformations Нет Упорядоченный список трансформаций. См. Трансформации.
errors Нет Error sink для неудачных записей.
resources Нет CPU/память для пода процессора.
nodeSelector, affinity, tolerations Нет Планирование пода.
checkpointPersistence Нет По умолчанию true. Для Nessie — при incrementalBySnapshot: true.
channelBufferSize Нет По умолчанию 100. Для высокой нагрузки Kafka — 500–1000.
replicas Нет По умолчанию 1. > 1 только для Kafka.
processorImage / processorVersion Нет Образ процессора.
imagePullSecrets Нет Pull secrets для пода.

Секреты

Credentials через SecretRef — см. Коннекторы — Secrets.

Валидация

При включённом validating webhook невалидный spec отклоняется на admission.

Те же правила применяются к встроенному DataFlowSpec в DataFlowCron.

См. также