Gambaran Umum

ETL (Extract, Transform, Load)

Sistem ETL di platform TechMaju menyediakan kemampuan integrasi data yang komprehensif, memungkinkan Anda untuk mengekstrak data dari berbagai sumber, mentransformasikannya sesuai dengan aturan bisnis, dan memuatnya ke dalam target DocTypes dalam aplikasi Frappe Anda.

Apa itu ETL?

ETL adalah singkatan dari Extract, Transform, Load - sebuah proses integrasi data yang:

  • Extract: Mengambil data dari database eksternal, API, atau file
  • Transform: Menerapkan logika bisnis, pemetaan data, dan aturan pembersihan data
  • Load: Menyisipkan atau memperbarui record dalam target DocTypes

Fitur Utama

  • Sumber Data Berganda: Dukungan koneksi ke database PostgreSQL atau MySQL
  • Transformasi Fleksibel: Pemetaan kolom, transformasi nilai, dan script Python khusus
  • Pemrosesan Bersegmen: Menangani dataset besar secara efisien dengan ukuran batch yang dapat dikonfigurasi
  • Penjadwalan Otomatis: Mengatur proses sinkronisasi data berulang
  • Logging Komprehensif: Melacak setiap operasi dengan log event yang detail
  • Integrasi Source Control: Semua konfigurasi ETL dikontrol versinya melalui Update Sets

Alur Kerja ETL

  1. Konfigurasi Koneksi Data: Mengatur kredensial untuk sumber data eksternal Anda
  2. Definisikan Sumber Data: Menentukan data apa yang akan diekstrak (tabel, query, API endpoint)
  3. Buat Transform Map: Mendefinisikan bagaimana data sumber dipetakan ke kolom target DocType
  4. Jalankan Ekstraksi: Mengekstrak data ke area staging dalam segmen yang dapat dikelola
  5. Eksekusi Transform: Menerapkan pemetaan dan aturan bisnis untuk membuat/memperbarui record
  6. Monitor Hasil: Meninjau log dan statistik untuk setiap operasi

Komponen ETL

Sistem ETL terdiri dari beberapa DocTypes utama yang dapat diakses melalui workspace Develop:

DocType Tujuan
ETL Data Connection Menyimpan kredensial koneksi database/API
ETL Data Source Mendefinisikan data apa yang akan diekstrak dari koneksi
ETL Transform Map Mengonfigurasi pemetaan kolom dan aturan transformasi
ETL Job Menjadwalkan proses ETL otomatis
ETL Import Batch Melacak operasi ekstraksi (dibuat sistem)
ETL Import Chunk Menyimpan data mentah yang diekstrak (dibuat sistem)
ETL Transform Run Mencatat hasil transformasi (dibuat sistem)

Memulai

  1. Navigasikan ke workspace Develop → bagian ETL
  2. Buat sebuah ETL Data Connection untuk sistem eksternal Anda
  3. Definisikan sebuah ETL Data Source yang menentukan data apa yang akan diekstrak
  4. Bangun sebuah ETL Transform Map untuk memetakan kolom sumber ke target DocType
  5. Uji ekstraksi dan transformasi secara manual
  6. (Opsional) buat sebuah ETL Job untuk penjadwalan otomatis

Keamanan & Performa

  • Semua password database dienkripsi menggunakan tipe kolom Password Frappe
  • Koneksi mendukung enkripsi SSL/TLS untuk transfer data yang aman
  • Pemrosesan bersegmen mencegah masalah memori dengan dataset besar
  • Pemrosesan background job menjaga UI tetap responsif
  • Penanganan error yang komprehensif

Discard
Save

On this page

Review Changes ← Back to Content
Message Status Space Raised By Last update on