Un data warehouse è un database relazionale , una banca dati elettronica in cui i dati vengono memorizzati in tabelle di righe e colonne . E 'progettato per query e analisi , piuttosto che l'elaborazione delle transazioni di tutti i giorni . Una transazione è un'unità di lavoro atomica , come pagare una bolletta dal tuo conto bancario , che o riesce o non riesce . A differenza di un sistema di elaborazione delle transazioni , un data warehouse non ha bisogno di rispondere immediatamente alle richieste degli utenti e ha altre caratteristiche uniche . Oggetto Oriented
Un database è progettato per aiutare gli analisti analizzare i dati . Come tali , i dati vengono memorizzati per materia , piuttosto che per l'applicazione , in altre parole , i dati è la materia esatto oggetto può variare da azienda ad azienda , ma un'azienda può decidere di strutturare il proprio data warehouse "soggetto -oriented". di vendita, spedizioni o inventario , in modo che possa rispondere a domande come : "Quale cliente ha acquistato la maggior parte di questo prodotto l'anno scorso ? "
Extract , Transform and Load
un'altra caratteristica di un data warehouse è che deve mettere insieme i dati provenienti da diverse banche dati operativi , file e segmenti di dati , li si presenta quindi in un formato coerente . Ciò significa che , prima che i dati vengono trasferiti in un data warehouse , deve subire un processo noto come estrazione, trasformazione e caricamento . Primo , questo processo estrae dati da una o più fonti di dati operativi. In secondo luogo, elimina le incoerenze dei dati , infine , carica i dati nel data warehouse . In ultima analisi, l'efficienza di questo processo determina la qualità dei dati in un data warehouse .
Volatile
Una volta trasferito in un data warehouse , i dati non non cambia e viene descritto come " non volatile ". I dati non è destinato a gestire l'attività giorno per giorno, a differenza di dati conservate nelle banche dati operative , non viene aggiornato dopo ogni singola operazione. Invece , i dati vengono trasferiti nel data warehouse a regolari intervalli specifici , come ad esempio una volta al giorno , una volta alla settimana o una volta al mese , a seconda della natura esatta dei dati .
Dati Storici
a differenza di un sistema di elaborazione delle transazioni , in cui i dati storici sono archiviati per mantenere le prestazioni del database , un data warehouse deve contenere i dati storici . Al fine di identificare le tendenze di business , analisti richiedono grandi volumi di dati , campionati nel corso del tempo , in modo da un data warehouse contiene storici "istantanee" dei dati operativi in orari specifici . In altre parole , i dati in un data warehouse è descritto come "variante di tempo ", perché la sua concentra principalmente cambiare nel corso del tempo .