airflow.providers.apache.spark.operators.spark_pipelines¶

Classes¶

SparkPipelinesOperator

Execute Spark Declarative Pipelines using the spark-pipelines CLI.

Module Contents¶

class airflow.providers.apache.spark.operators.spark_pipelines.SparkPipelinesOperator(*, pipeline_spec=None, pipeline_command='run', conf=None, conn_id='spark_default', num_executors=None, executor_cores=None, executor_memory=None, driver_memory=None, verbose=False, env_vars=None, deploy_mode=None, yarn_queue=None, keytab=None, principal=None, openlineage_inject_parent_job_info=conf.getboolean('openlineage', 'spark_inject_parent_job_info', fallback=False), openlineage_inject_transport_info=conf.getboolean('openlineage', 'spark_inject_transport_info', fallback=False), **kwargs)[source]¶

Bases: airflow.providers.common.compat.sdk.BaseOperator

Execute Spark Declarative Pipelines using the spark-pipelines CLI.

This operator wraps the spark-pipelines binary to execute declarative data pipelines. It supports running pipelines, dry-runs for validation, and initializing new pipeline projects.