pulizia dei dati è il processo di fissazione dei dati e la rimozione di dati non necessari al fine di ottimizzare le operazioni di datawarehousing quotidiane . Datawarehousing è la memorizzazione di dati in un archivio centrale in modo che chiunque in una organizzazione in grado di accedervi. Al fine di datawarehousing per avere successo, le informazioni del database deve essere accurata . Tuttavia, data la grande quantità di dati che le aziende lavorano, questi dati possono non sempre essere corretti manualmente . Pertanto , è necessaria la pulizia automatica dei dati . Disponibilità
pulizia dei dati deve rendere i dati più rilevanti rapidamente accessibili a coloro che sono alla ricerca di esso . Tempo sprecato la ricerca attraverso le informazioni irrilevanti possono perdere tempo per i dipendenti e le risorse aziendali dei rifiuti. Le informazioni che è ridondante può sprecare spazio di archiviazione dell'azienda .
Integrità
pulizia dei dati non deve cancellare o modificare i dati per cui i dati diventa impreciso. Dati inesatti possono causare alle aziende di fare errori come ad esempio l'invio di un disegno di legge per l' indirizzo errato, che possa clienti rabbia e denaro dei rifiuti . I dati devono inoltre essere aggiornati per tutto il database . Se gli aggiornamenti di un cliente di un indirizzo di fatturazione , questo aggiornamento dovrebbe essere distribuito alle banche dati in tutti i dipartimenti .
Organizzare
pulizia dei dati dovrebbe prendere i dati rilevanti da diverso fonti e spostare automaticamente questi dati in posizioni appropriate in modo che i dati possono essere facilmente trovati in caso di necessità . Questo elimina la necessità di creare nuovi dati quando i dati esistono già .
Error Correction
errori e incongruenze , come ad esempio un nome scritto male , dovrebbe essere situato e corretto da dati processi di pulizia . Gli errori devono essere corretti soprattutto nella programmazione di software per computer , dal momento che tali errori possono causare sistemi informatici per non funzionare correttamente .
Automazione
Dati strumenti di pulizia dovrebbero ridurre al minimo la quantità di manuale ingresso che è necessario. In altre parole , gli amministratori di database non dovrebbero avviare continuamente i processi stessi, ma questi processi devono avvenire automaticamente . Ci dovrebbe essere anche il minimo sforzo di programmazione necessari . I programmatori non dovrebbero codificare ogni volta che un azione di routine viene effettuata.
Semplicità
Dati strumenti di pulizia devono semplificare le informazioni quando possibile. Dati complicati rifiuti risorse aziendali e forze anche ai dipendenti di dedicare più tempo alla ricerca di alcune informazioni .
Analisi post - processo di analisi è l'esame manuale dei dati dopo che i dati è stato ripulito . Non importa quanto i dati efficaci processi di pulizia sono , possono verificarsi degli errori inevitabili . Gli amministratori di database hanno ancora bisogno di controllare regolarmente i dati manualmente , al fine di garantire che i dati siano accurati . Dati strumenti di pulizia dovrebbe permettere agli amministratori di visualizzare i dati in un formato facilmente comprensibile, in modo che le correzioni possono essere fatte rapidamente .
Efficiency
pulizia dei dati può essere lunga e costosa . Tutto ciò che può accelerare lungo il processo di pulizia dei dati o ridurre i costi associati alla pulizia dei dati è necessario al fine di massimizzare la redditività aziendale .