Справочник spec DataFlow
Описание полей DataFlow spec. Оркестрация (Deployment, реконсиляция, status) — в Жизненный цикл и status.
Структура CRD
flowchart TB
subgraph DataFlow["DataFlow"]
Spec["spec"]
Status["status"]
end
subgraph SpecFields["поля spec"]
Source["source (обязательно)"]
Sink["sink (обязательно)"]
Trans["transformations (опционально)"]
Errors["errors (опционально)"]
Resources["resources (опционально)"]
Scheduling["scheduling (опционально)"]
Checkpoint["checkpointPersistence (опционально)"]
ChannelBuffer["channelBufferSize (опционально)"]
Replicas["replicas (опционально, Kafka)"]
Image["processorImage / processorVersion (опционально)"]
end
Source --> SourceTypes["type: kafka | postgresql | trino | clickhouse | nessie"]
Sink --> SinkTypes["type: kafka | postgresql | trino | clickhouse | nessie"]
Trans --> TransTypes["timestamp | flatten | filter | mask | router | select | remove | snakeCase | camelCase"]
Spec --> Source
Spec --> Sink
Spec --> Trans
Spec --> Errors
Spec --> Resources
Spec --> Scheduling
Spec --> Checkpoint
Spec --> ChannelBuffer
Spec --> Replicas
Spec --> Image
Поля spec
| Поле | Обязательность | Описание |
|---|---|---|
source |
Да | Тип и конфигурация источника. См. Коннекторы. |
sink |
Да | Основной приёмник. |
transformations |
Нет | Упорядоченный список трансформаций. См. Трансформации. |
errors |
Нет | Error sink для неудачных записей. |
resources |
Нет | CPU/память для пода процессора. |
nodeSelector, affinity, tolerations |
Нет | Планирование пода. |
checkpointPersistence |
Нет | По умолчанию true. Для Nessie — при incrementalBySnapshot: true. |
channelBufferSize |
Нет | По умолчанию 100. Для высокой нагрузки Kafka — 500–1000. |
replicas |
Нет | По умолчанию 1. > 1 только для Kafka. |
processorImage / processorVersion |
Нет | Образ процессора. |
imagePullSecrets |
Нет | Pull secrets для пода. |
Секреты
Credentials через SecretRef — см. Коннекторы — Secrets.
Валидация
При включённом validating webhook невалидный spec отклоняется на admission.
Те же правила применяются к встроенному DataFlowSpec в DataFlowCron.