将非 Unicode、非英语内容转换为 Unicode


converting non-unicode, non-english content to unicode

我有一个"xyz"语言的文本内容。

<p style="font-family:xyz;"> eWvS³: kmwkMnsâ kq¸Àt^mWmb KmeIvkn kocoknsâ aq¶mw]Xn¸v </p>
// It will not display correctly as font is not embedded.
这里的字体xyz

(xyz.ttf)是非Unicode。

现在我想将"XYZ"(xyz.ttf)字体文本转换为Unicode"PQR"(pqr.ttf)字体

简单地说,一个非 unicode 中文 (non_uni_chinese.ttf) 到 uniocode 中文 (uni_chinese.ttf)

我怎样才能使用PHP来实现。

你必须"逐个字符"地执行此操作。

这意味着您必须将"非Unicode中文"字体中的每个字符替换为Unicode字体。我对中文了解不多,但在越南中,他们使用这种方式:

  1. 用 Unicode 字体编写包含"非 Unicode"字体的字符串,这些字符将无法正确显示。例如:Ñaây laø Tieáng Vieät <- 这是一个非Unicode越南语书写,使用Unicode字体。
  2. 将"逐字"改为"逐字"。例如:Ñ = Đ;aâ = â;aø = 2;...
  3. 然后我们得到这个结果:Đây là Tiếng Việt。

当然,我们不会一步一步地做,我们使用一个名为"Unikey"的软件来做到这一点。

我敢肯定有一个中文软件可以做到这一点。这里的重点是你必须在PHP中再次"做"它。

这里有一些东西可以帮助你:http://www.pinyin.info/tools/converter/chars2uninumbers.html

祝你好运。

生成的输出应使用一种编码。这不是正确的解决方案,但无论如何,要将字符串转换为不同的编码,您应该使用 iconv 函数 http://www.php.net/manual/en/function.iconv.php