Il data mining è il processo di analisi e sintesi dei dati da diverse prospettive . Si sforza di definire modelli di dati e relazioni attraverso grandi pool di informazioni utilizzando algoritmi --- complessi di norme che risolvono un problema in una serie di iniziative concrete (si pensi l'algoritmo di Euclide in algebra , che trova il massimo comune divisore due numeri ' ) . La Conferenza Internazionale IEEE 2006 sul Data Mining classificato i 10 algoritmi in campo. Decision Trees
algoritmi albero di decisione hanno lo scopo di organizzare i dati su scelte concorrenti in rami di influenza dopo una decisione iniziale . Il tronco dell'albero rappresenta la decisione iniziale , e comincia con un sì - o - no domanda , come se o non mangiare la prima colazione . Mangiare la prima colazione e non mangiare la prima colazione sarebbe i primi due rami divergenti dell'albero , e ogni scelta in seguito avrebbe avuto i suoi rami divergenti che portano a un punto finale .
Il K -Means Algoritmo < br >
L'algoritmo k-means è basato su cluster analysis . Ha lo scopo di rompere i dati raccolti in "gruppi" distinti raggruppati per caratteristiche simili.