Miniere e-mail è un mezzo di estrazione di informazioni , come ad esempio il numero di parole , frasi , o la ricchezza del vocabolario del vostro corrispondente , dal testo in email . Scrivere un minatore email con Python richiede molte " parti mobili " sotto forma di estensioni Python , chiamati pacchetti , che i messaggi di posta di download di server . I messaggi vengono convertiti in stringhe in modo che gli altri pacchetti di Python possono analizzare e mostrare loro quello che trovano . Questo è un compito molto complesso che richiede più di un passaggio casuale conoscenza di programmazione Python . Quindi , procedere con cautela e pazienza . Cose che ti serviranno
connessione Internet
Python 2.6 o superiore
NLTK Python Package
Mostra più istruzioni
1
Aprire una sessione di terminale e digitare python - v alla richiesta di verificare di avere Python 2.6 o superiore, ma non 3.0 o superiore . Le versioni 2.6 o 2.7 sono l'ideale , perché sono compatibili con NLTK e PyYAML . Visita la pagina di indice dei pacchetti Python , trovare e scaricare i pacchetti PyYAML e NLTK . Unzip /estragga loro. Cambiare la directory nella directory PyYAML . Al prompt dei comandi, digitare : sudo python setup.py install . Dovrebbe apparire così:
My- Computer: PyYAML - 3.2.0 Me $ sudo python setup.py install
Verrà richiesto di immettere una password . Digitare e premere il tasto di ritorno . Seguire questa procedura per ogni pacchetto di Python si installa
2
Scarica messaggi di posta elettronica per l'analisi con le seguenti righe di codice : . !
# /Usr /local /bin /python < br >
importazione poplib , getpass , sys , mailconfig
mailserver = mailconfig.popservername
mailuser = mailconfig.popusername
mailpasswd = getpass.getpass ( 'Password per% s ? '% mailserver ) per
server = msgBytes = server.stat ( ) per
print (' ci sono ' , msgCount , ' i messaggi di posta elettronica in ' , msgBytes , ' byte ' ) per
stampa ( server.list ( ) ) < br
stampa > ( '-' * 80 ) per ingresso
( ' [ Premere il tasto ENTER ] ' ) per
for i in range ( msgCount ) :
hdr , messaggio , ottetti = server.retr ( i +1 ) per
per la linea in un messaggio: print ( line.decode ( ) ) per
read ( '-' * 80 ) per < p > se i < msgCount - 1 :
Questo script si connette al server di posta elettronica POP3, chiederà di inserire il nome utente e la password , contare il numero di messaggi sul server e li lesse in memoria < br . >
3
miniera di messaggi e-mail mediante la conversione di ogni messaggio in una stringa , un tipo nativo di dati in Python , che può essere cercato con metodi di Python stringhe , motore di espressioni regolari , e Natural Language Toolkit : < br >
m = msgCount [ 1]