将不同的语言字符和重音解析为有效的XML


Parsing different language characters and accents into valid XML

我有一堆具有不同语言数据的XML数据,这些数据具有重音。例子:-

<text content="vídeo..." /> or <text content="vidéo..." />

这些数据来自MySQL -然后我用SimpleXML组装数据-当这些字符在内容中时,它甚至拒绝将数据放入。

尝试(如有人建议)使用utf8_encode()在手之前的数据,只是为了看看是否有帮助。

我错过了什么明显的吗?

欢迎学习字符编码。首先,必须确保所使用的编码与使用XML的地方相匹配。用于添加数据的编码必须与XML文件中的编码相同。如果只是为了你的环境,你可以使用最适合你的编码,但如果你需要它在全球范围内工作,UTF-8是你最好的选择。

如果你有编码中不知道的字符,你必须将字符串编码为字符引用。如果您对实体引用和htmlentities()所做的那样做,您将不得不在XML文件中添加一些实体引用的DTD,因为XML只知道少数缺省值。如果需要一些dtd,可以在这里下载。如果不能使用DTD,则必须在XML文件中使用数字引用。