Il linguaggio di programmazione Python utilizza espressioni regolari per il pattern matching . I programmatori spesso usano espressioni regolari per la ricerca di testo per i modelli di lettere, simboli e numeri . La potenza delle espressioni regolari deriva dal fatto che essi non sono utilizzati per la ricerca di qualcosa di specifico , come la parola 'cane' , invece , vanno alla ricerca di parole che corrispondono a un determinato modello , come ad esempio i nomi di dominio di posta elettronica . Ad esempio, è possibile utilizzare Python per sostituire i nomi di dominio di un elenco di indirizzi e-mail utilizzando le espressioni regolari . Cose che ti serviranno
computer con il linguaggio di programmazione Python installato
Show More Istruzioni
1
Aprire l' editor di testo IDLE che viene fornito in bundle con il linguaggio Python , cliccando sulla sua icona . L'icona editor di testo IDLE si trova nella directory di Python nel tuo elenco dei programmi installati (che si trova sotto Tutti i programmi del menu Start di Windows , e all'interno della cartella Applicazioni in OSX) . Un file di codice sorgente di vuoto si apre nella finestra principale
2
Calcola il 're ' del modulo scrivendo questa riga all'inizio del file di codice sorgente : .
Import re
3
dichiarare una stringa e assegnare alcuni indirizzi di posta elettronica ad esso , come ad esempio questo :
EmailAddresses = ' William@amail.com , John@bmail.com , Bruce @ cmail.com '
4
Creare una espressione regolare che cerca tutte le possibili permutazioni di testo in indirizzi email validi . Le espressioni regolari lavorano per la ricerca di un modello di caratteri di una stringa di testo . Il modello ti interessa è ogni due parole unite da un simbolo @ . Poiché gli indirizzi e-mail hanno molti caratteri validi , si desidera far corrispondere tutti i caratteri possibili in ogni parola , prima e dopo il simbolo @ . Ciò si ottiene con l'espressione regolare [ \\ w \\ - . ] , E con l'aggiunta di un + alla fine di esso , è possibile ripetere questa operazione per tutti i personaggi . L'espressione regolare compilato può essere salvato in una stringa come questa:
regexPattern = r ' ( [ . \\ W \\ - ] + ) @ ( [ . \\ W \\ - ] + ) '
< br > 5
creare un'espressione regolare che sostituisce tutti i nomi a dominio con " zmail.com . " In questa espressione regolare , la sequenza di caratteri riferimento all'indietro \\ 1 è usato per sostituire il dominio degli indirizzi email. Il backreference si riferisce ad una posizione in una espressione regolare , circondata tra parentesi. Applicando l'espressione regolare per il primo riferimento all'indietro , si salva l' indirizzo di posta elettronica , ma mettere da parte il vecchio nome di dominio . È quindi possibile aggiungere un nuovo nome di dominio , come ' @ zmail.com . ' Per salvare questa seconda espressione regolare a una variabile, è possibile scrivere questo :
regexReplacement = r ' \\ 1@zmail.com '
6
Applicare le espressioni regolari per la stringa contenente gli indirizzi email come questo :
EmailAddresses = re.sub ( regexPattern , regexReplacement , EmailAddresses ) economici 7
Stampa fuori gli indirizzi con questa riga di codice . Python 3 utilizza questa sintassi per la stampa : print ( EmailAddresses ) , mentre Python 2 utilizza questa sintassi: stampa EmailAddresses
8
Eseguire il programma premendo il tasto F5 . . L' output del programma è :
William@zmail.com , John@zmail.com , Bruce@zmail.com