Tutti i database richiedono manutenzione e gestione in corso al fine di mantenere la loro efficienza e la velocità . Noi esploreremo diverse tecniche utilizzate dagli editori per assicurare che il loro dati sono al sicuro , e il loro software continua a svolgere , se necessario. Dati Normalizzazione
Normalizzazione significa che tutti i dati presenti nel database è iscritto allo stesso modo. . E 'fondamentale per la funzionalità di qualsiasi database , e deve essere costantemente monitorata quando un database viene regolarmente aggiornato con l'immissione dei dati a mano con chiave
Per esempio , si considerino i seguenti tre nomi: John Smith , Jonathan Smith , Jonathan R. Smith . Un lettore umano potrebbe capire che tutti e tre i nomi si riferiscono alla stessa persona , in modo che quando John Smith chiama chiedendo un ordine che è stato inviato a Jonathan , le sue esigenze può essere gestita correttamente . Una base di dati , tuttavia, non può fare il collegamento tra questi tre nomi , e li considererà come tre clienti separati ( con tre storie ordinare a parte) , se tutti e tre i nomi sono inseriti a mano.
Allo stesso modo , appaiono questi i numeri di telefono lo stesso : (215) 555-2150 e 215-555-2150 . Ma non sono la stessa ad una banca dati; seconda di come il software tratta trattini in stringhe di testo , il primo numero di telefono è di due parole , ma il secondo è una sola. Qualsiasi copione programmatico che seleziona un codice di area per l'analisi con la parola, per esempio , avrà esito negativo se si considera il secondo numero
Il modo migliore per evitare problemi di normalizzazione è con rigoroso controllo di immissione dei dati : . Sia impedire a un utente di entrare dati malformati , o meglio ancora prendere i dati e riformattare ma prima di riporla internamente. Un campo numero di telefono potrebbe buttare via tutto ciò che non è un 0-9 tra parentesi e trattini cifra e aggiungere - ma deve prima convertire o rifiutare i numeri di telefono alfanumerici come 800-MY-PHONE
Database . Dimensione fisica, utilizzo della RAM e la velocità
Basi di dati tendono a crescere nel tempo , è comune per le aziende di concentrarsi sulle immettere i nuovi dati in loro, ma per pagare molto meno attenzione all'abbattimento dei dati vecchi e inutilizzati fuori. Raramente è una buona idea di buttare via i vecchi dati , ma è sempre possibile che alcune informazioni cruciali per il futuro sarà guadagnato aggregando e analizzare i record del database ultimi
Ciò significa che il gestore di database deve prestare attenzione . la dimensione fisica del database memorizzato sul disco. In generale , è importante mantenere una massiccia quantità di spazio libero in testa su unità di storage , in questo modo , uno script canaglia che crea accidentalmente un milione di nuovi record di un'ora non è in grado di riempire un disco e causare un crash del database critico prima di poter essere arrestato
.
dirigenti dovrebbero inoltre prestare attenzione a come le loro ipotesi iniziale di programmazione cambiano nel tempo , come i database diventano grandi . Ricerche nelle banche dati tirare fuori i dati del disco e nella memoria RAM , che crea un massimale per gli algoritmi di ricerca efficienti , una ricerca che è stata istantanea attraverso 10.000 record potrebbe richiedere ore , quando il numero di record cercato è 250.000. Ricerca e programmazione di algoritmi dovrebbero essere regolarmente testati e distribuiti nel tempo , in modo che possano essere migliorati , se necessario, contro i set di dati più grandi.