Parsing di XHTML con SimpleXML

Venerdì 2 Ottobre 2009 - 08:21

di Gabriele Romanato

PHP e Open Source

Sto eseguendo dei test per alcuni articoli che ho intenzione di scrivere su XHTML e PHP e devo dire che i primi risultati sono incoraggianti. In breve, la libreria SimpleXML è in grado di eseguire il parsing di XHTML quando quest’ultimo è servito come application/xhtml+xml.

Nulla di strano si direbbe, eppure ciò lascia ben sperare per quanto riguarda il supporto a questo Content-Type non solo da parte di PHP, ma anche da parte dei browser.

Infatti, tramite PHP è possibile filtrare un documento XHTML e renderne parti della sua struttura anche sui browser che non forniscono un supporto completo (come IE). Un semplice test è il seguente:

<?php
$xhtml = simplexml_load_file('test.xht');
echo '<pre>';
print_r $xhtml;
echo '</pre>';
?>

L’output darà come risultato il parsing tree del documento XHTML in questione, mostrando la gerarchia di oggetti al suo interno. Come prossimi test ho intenzione di sperimentare l’uso dell’estensione DOM e di SAX su documenti XHTML serviti come application/xhtml+xml. A presto!

Tags:

Categoria: PHP e Open Source | Permalink

Commenti

1

Ma non sarebbe ora di eliminarlo l’XHTML?

# - postato da lordmax - 02 Ottobre 2009 - 13:04

2

purtroppo XHTML è destinato a scomparire… per fare il parsing dell’HTML invece vi suggerisco questa libreria:

http://simplehtmldom.sourcefor.....ge.net/

per certi aspetti funziona in modo simile ai framework JavaScript

per esempio con questo codice:

$html->find(’li[class=active]’);

si possono ottenere tutti gli elementi “li” con classe “active”

# - postato da Valentino - 02 Ottobre 2009 - 13:15

3

se e’ per questo, c’e’ anche http://querypath.org/ che usa una sintassi simile a JQuery

# - postato da pbattino - 02 Ottobre 2009 - 14:18

4

così, giusto per capire, ma per quale motivo xhtml sarebbe destinato a scomparire?

# - postato da Livio - 06 Ottobre 2009 - 10:36

Inserisci il tuo commento:





(puoi usare i seguenti tag HTML per formattare il testo -
a href, b, i, br/, p, strong, em, ul, ol, li, blockquote, pre):

 

Anteprima del commento