database software ricevono informazioni da una varietà di fonti e di memorizzare le informazioni per l'uso da programmi e gli utenti finali . Non tutte le informazioni sono presentate in un formato che un database in grado di gestire , i dati devono subire alcune modifiche per renderlo compatibile con il formato di database . Processi di estrazione, trasformazione e caricamento rendono possibile per le informazioni a venire da una fonte di dati e di essere caricato in un database. Estrazione
Extraction è il processo di prendere i dati da un file di sistema di origine o in altri luoghi per l'eventuale integrazione in un database. Se i dati vengono estratti correttamente allora processi successivi è probabile che si verifichino problemi se non mancano del tutto . L'estrazione è particolarmente importante per i database che attingono informazioni da più fonti come i file system utilizzati dal ciascuna sorgente può non essere pienamente compatibile con il database o l'altro. Possono essere necessari metodi di estrazione multipli per garantire la corretta estrazione da tutte le fonti .
Trasformare
Il processo di trasformazione prepara i dati estratti per il caricamento in un database . A seconda delle analogie tra il file system utilizzata dell'origine dati e quella del database, un certo numero di modifiche ai dati può essere necessario per renderla compatibile con il sistema di file di database . Questi cambiamenti possono includere la fusione di diversi campi di dati , la traduzione dei dati da un formato ad un altro e le regolazioni per l'orientamento dei campi di dati in modo che corrispondano al formato corrispondente del database .
Caricamento
Il processo di caricamento richiede dati che sono stati trasformati e genera nuovi record del database in base a questi dati. Questi nuovi documenti sono in formato database standard e sono accessibili dal software o utenti con credenziali appropriate o privilegi di amministratore del database . Ulteriori modifiche possono essere apportate ai dati da parte di utenti o di software di database , anche se tali modifiche non si rifletteranno nei dati ancora detenute alla fonte originale .
Utilizzo di ETL Processi
processi ETL
sono spesso utilizzati nel data warehousing e di operazioni analoghe in cui grandi quantità di dati sono tratti da una serie di diversi computer o server . I tre processi lavorano insieme per garantire che i dati siano correttamente convertito dal formato sorgente ad una forma che può essere utilizzata dal database centrale senza errori . Senza l'uso di processi ETL , i dati possono essere registrati in modo non corretto nel formato del database o può finire per non essere registrati affatto .