airflow 를 대체할 수 있다고 자부(🧙 A modern replacement for Airflow) 하는 mage 를 살펴본다.

background


데이터셀에서 사용중인 dbt 에 불편사항들이 존재한다.

  1. 환경 설정이 번거롭다
    • python 설치도 안되어 있는 사용자도 있다.
    • poetry 설치가 잘 안된다. (poetry path 설정)
    • dbt dependency 설치가 필요하다.
  2. backfill 작업이 번거롭다.
    • incremantal model 의 컬럼 추가 작업 시 기존 테이블 삭제 및 재실행이 필요하다.
    • 수동 테이블 삭제(콘솔 이용)와 dbt run 이 필요하다.
  3. (분석가가 사용하기에) dbt CLI 가 까다롭다.
  4. main 브랜치에 대한 run을 할 수 없다.
    • 응급 상황에 대한 대처가 어렵다.

개선된 환경을 위해 고민하던 중 mage 도구를 알게되었고, 도입이 가능한 지(위 불편사항들을 제거할 수 있는지) 검토하고자 한다.

💁‍♂️ mage?


|400

기능확인


🙆‍♂️ 환경 설정이 번거롭다

🙆‍♂️ backfill 작업이 번거롭다

🤷‍♂️ (분석가가 사용하기에) dbt CLI 가 까다롭다

🙆‍♂️ main 브랜치에 대한 run을 할 수 없다

IMO