使用 simplexml 加载格式错误的 xml


Load xml malformed with simplexml

我有一个格式错误的 xml 文件,基本上它在标签中有 &(&) 并且它们没有转义......

这是我用于加载 xml 的代码。

$archivo = "tarifa_mayorista.xml";
echo "Reading file<br>";
if (file_exists($archivo)) {
  $articulos = simplexml_load_file($archivo); 
  if($articulos){
    foreach ($articulos->Categoria as $rs) { 
        $categoria = (string) $rs->TxCategoria;
        $subCat = (string) $rs->SubCategoria[0]->TxSubCategoria;
        $cod = (string) $rs->SubCategoria[0]->SubCategoria2[0]->PartNumber;
        $stock = (string) $rs->SubCategoria[0]->SubCategoria2[0]->Stock;                
        $precio = (string) $rs->SubCategoria[0]->SubCategoria2[0]->Precio;
        $fabricante = (string) $rs->SubCategoria[0]->SubCategoria2[0]->Fabricante;  
        $ean = (string) $rs->SubCategoria[0]->SubCategoria2[0]->EAN;  
        $descripcion = (string) $rs->SubCategoria[0]->SubCategoria2[0]->Descripcion;
        $canon = (string) $rs->SubCategoria[0]->SubCategoria2[0]->Canon;
        $desc = mysql_real_escape_string($descripcion);     
        $sql2="insert into `activadosmil` 
               set  cod='".trim($cod)."', stock='".trim($stock)."', precio='".trim($precio)."', categoria='".$categoria."', 
               subcategoria='".$subCat."', descripcion='".$desc."', ean='".trim($ean)."', canon='".trim($precio)."', fabricante='".trim($fabricante)."'"; 
        mysql_query($sql2) or die(mysql_error()."<hr>".$sql2); 
    }       
  } else echo "<br>Invalid XML sintaxis";
} else echo "<br>Error opening ".$archivo;

/* 示例 XML 代码 */

<Categoria>
    <TxCategoria>ALMACENAMIENTO</TxCategoria>
    <SubCategoria>
        <TxSubCategoria>CARCASAS DISCO DURO</TxSubCategoria>
            <SubCategoria2>
                <TxSubCategoria2>2,5"</TxSubCategoria2>
                <PartNumber>5VECTRIXALU3,5</PartNumber>
                <Fabricante>TACENS</Fabricante>
                <EAN>4710700954461</EAN>
                <Descripcion>MONITOR ASUS LED&PIP 27 VE278Q</Descripcion>
                <Precio>       12.37</Precio>
                <Stock>        0</Stock>
                <Canon>      0.00</Canon>
            </SubCategoria2>
    </SubCategoria>
</Categoria>

有没有办法用 simplexml 加载格式错误的文件 ?还是从标签中转义字符?

提前谢谢你们

这是一个幼稚的解决方案,如果您对 & 符号的问题与您的问题一样幼稚,它将起作用。

您可以先以字符串形式获取文件内容:

$contents = file_get_contents($archivo);

然后,您可以运行一个str_replace,将所有出现的&替换为&amp;

$contents = str_replace('&', '&amp;', $contents);

现在,将转义的字符串加载到您的 simplexml 中:

$articulos = simplexml_load_string($contents);