| Home  | Casa  | Hardware  | Networking  | Programmazione  | Software  | Domanda  | Sistemi  |   
Programmazione  
  • C /C + + Programming

  • Computer Programming Languages

  • Delphi Programming

  • Java Programming

  • Programmazione Javascript

  • PHP /MySQL Programmazione

  • Perl Programming

  • Python Programming

  • rubino Programmazione

  • Nozioni di base di Visual Programming
  •  
    Conoscenza Informatica >> Programmazione >> Python Programming >> Content
    Procedura: Regex per analizzare XML
    XML Parsing rappresenta una sfida per il aspiranti testo analizzatore a causa di estensibilità di XML . Convenzioni di formattazione XML sono di natura gerarchica , cioè alcuni tag dominano altri tag . Le espressioni regolari ( regex ) identificare i modelli di testo XML - una regex per la corrispondenza tag XML corrisponderà tutto dentro i tag XML < > , ma non visualizza l'organizzazione gerarchica di questi tag . E ' possibile separare questa struttura di tag dal testo utilizzando il linguaggio di programmazione Python e il pacchetto di Natural Language Toolkit , che incorpora le espressioni regolari e manipolazione di testo e in grado di visualizzare i tag XML e la loro organizzazione . Istruzioni
    1

    Aprire una finestra di terminale e digitare il comando "python -v " al prompt di verificare la presenza e la versione di Python sul ​​vostro computer . Vai alla homepage NLTK e scaricare il pacchetto di installazione NLTK appropriato per il sistema operativo . Controllare che NLTK è installato correttamente digitando il comando " >>> import NLTK " al prompt di Python .
    2

    Tipo " >>> nltk.download ( ) " a aprire una finestra . Scegliere la riga con l'etichetta " tutti" e fare clic sul pulsante di download . Questo scaricherà una serie di testi per NLTK a lavorare con , tra i quali di Shakespeare " Il Mercante di Venezia " formattata con tag XML speciali per i giochi.
    3

    Importa il mercante di Venezia taggato in XML con il seguente comando al prompt di Python:

    >>> merchant_file = nltk.data.find ( ' corpora /shakespeare /merchant.xml ' ) per

    Assegnare al file un variabile in modo che si può manipolare con i comandi di Python : .

    >>> grezzo = open ( merchant_file ) read ( ) per

    Giusto per fare in modo che sia lì , immettere il seguente comando per visualizzare i primi 168 caratteri : .

    >>> stampa grezza [ 0:168 ]

    vedrete i tag di intestazione XML e le speciali etichette gioco XML < br >
    4

    Immettere il seguente comando al prompt di Python :

    >>> da nltk.etree.ElementTree importazione ElementTree

    e premere il tasto " Return ", quindi digitare quanto segue al prompt di Python : .

    >>> commerciante = ElementTree ( ) parse ( merchant_file ) per

    il comando parse permette all'utente di visualizzare i tag XML e del loro contenuto . Per costruire una visione gerarchica di tag XML correttamente nidificati , inserire il seguente comando al prompt di Python :

    >>> merchant.getchildren ( ) per

    Questo mostrerà tutti i particolari XML giocare tag nel loro ordine gerarchico . L' output di questo comando dovrebbe essere simile a questo :

    [ elemento> TITOLO a 2261b48> , PERSONAE , elemento> SCNDESCR a 22cc260> , elemento> PLAYSUBT a 22cc198> , < , Element ACT a 22cc0f8 > , elemento> ACT a f2bff08> , elemento> ACT a f3218a0> , elemento> ACT a f0e8a30> , elemento> ACT presso ee07328> ]
    < br >

    Previous :

    next :
      Articoli Correlati
    ·Python Metodi speciali 
    ·Come fare nomi globali Python 
    ·Come trovare la media di una lista in Python 
    ·Che cosa sono pyc 
    ·Come pacchetto python Scripts 
    ·Come scegliere elenchi casuali da Python 
    ·Come usare MiKTeX Con Python 
    ·Come compilare un dizionario di numeri in Python 
    ·Come fare un VAR globale in Python 
    ·Procedura: Metodo per Pylon target di montaggio 
      Articoli in evidenza
    ·Come fare il software di sicurezza in VB.Net 
    ·Come eseguire il debug C + + Tag 
    ·Come controllare se due matrici hanno gli stessi elemen…
    ·Dati GridView Misto Tipo di tessuto 
    ·Come personalizzare GVIM per HTML Coding 
    ·Come recuperare un collegamento ipertestuale da una cel…
    ·Come utilizzare un buffer temporaneo in C + + 
    ·Che cosa è la correzione Sub - Pixel 
    ·Come fare una funzione di radice quadrata in Java 
    ·Come lista delle variabili PHP 
    Copyright © Conoscenza Informatica http://it.wingwit.com