esistono strumenti di analisi del testo per gli amministratori di sistema e progettisti web che hanno bisogno di cercare grandi quantità di testo per determinare la struttura e l'organizzazione dei computer, script di sistema o di documenti - up segnare . Script veloce e sporco SED e Perl costruite intorno le espressioni regolari sono spesso sufficienti per lavori semplici , ma parsing di documenti XML complessi richiede uno strumento più robusto , come la biblioteca ElementTree del linguaggio di programmazione Python . Cose che ti serviranno
Python 2.5 o superiore
Mostra più istruzioni
1
avviare una sessione di terminale o , se preferite, aprire il Python Integrated Development Environment , conosciuto come IDLE , che si trova nella directory di Python nel vostro disco C (Windows ) o nella cartella Applicazioni ( Mac ) . Controllare la versione di Python digitando python -v al prompt della riga di comando . ElementTree è parte della libreria standard di Python come di Python 2.5 . Se si dispone di Python 2.4 o precedente, è necessario scaricarlo dal la pagina principale di Python .
2
determinare il tipo di dati codificati in un documento XML con la lettura del tag radice . Nella riga di comando prompt carico ElementTree e la sua funzione di analisi con il seguente comando :
> da elementtree.ElementTree import parse
3
Individuare il file che si desidera analizzare e prendere nota del suo percorso in relazione a quella dell'interprete Python , o semplicemente spostare il file nella cartella Documenti. Impostare una variabile per il file , leggerlo in memoria e scoprire il tipo di dati del file contiene il seguente comando: > albero = ElementTree ( file = nomefile) > elem = tree.getroot ( ) > print elem < br >
Questo rivelerà il tipo di dati contenuti nel documento XML .