Se si consente agli utenti di caricare contenuti al tuo sito web , la cattura di contenuti plagiati abbatte i costi per la memorizzazione di oggetti rubati e testo. È possibile utilizzare PHP per valutare il contenuto e restituire una percentuale che rappresenta il fattore di somiglianza per due URL . Questo ti permette di strisciare siti web e confrontare due URL con l'altro per scoprire se il contenuto di una pagina è simile al contenuto di un altro URL. Istruzioni
1
aprire l'editor di PHP e il file di codice sorgente che si desidera utilizzare per eseguire la scansione degli URL e di confrontare contenuti simili .
2
Creare due variabili URL e impostare una terza variabile che restituisce il numero di caratteri che corrispondono nelle due pagine . Il codice seguente imposta le variabili :
$ url1 =''; $ url2 =''; $ stessa = 0 ;
3
ottenere il contenuto dei due URL. Il codice che segue inizializza e recupera il contenuto di due URL :
$ curl = curl_init (); curl_setopt ( $ curl, CURLOPT_URL , $ url1 ) ; $ contenuto1 = curl_exec ( $ curl ) ; curl_setopt ( $ curl, CURLOPT_URL , $ url2 ) ; $ contenuto2 = curl_exec ( $ curl ) ;
4
Confronta le due stringhe contenuti URL . Il codice seguente restituisce il numero di caratteri consecutivi da " $ contenuto1 " che corrisponde al contenuto in " $ contenuto2 " :
$ simile = strstr ( $ contenuto2 , $ contenuto1 ) ; $ similarcount = strlen ( $ simili) ;
5
dividere il valore " $ similarcount " per la lunghezza totale della stringa Questo numero ti dà il fattore di somiglianza o la percentuale di contenuto simile che corrisponde a " $ contenuto1 . " dal vostro URL originale . Utilizzare il codice seguente per calcolare il fattore :
$ fattore = $ similarcount /( strlen ( $ contenuto2 ) ) ; echo $ fattore ;