从html PHP中删除非标准字符


Remove non-standard characters from html PHP

如何删除只有"(使用curl获取数据)

$str = "Check this out <a href=�http://www.somewebsite.com�>Somewebsite</a>, this is a great website
Windows� (XP 32bit/Vista/7/8/8.1)";

我只是想要*被删除。I tried

$output = preg_replace("/[^A-Za-z0-9]/","",$str);

it remove HTML also…但是我想要的是HTML

与其这样做,不如修复字符集问题。您的问题可能是您没有在应用程序/脚本的所有级别中使用相同的字符编码。任何具有或可以设置为特定字符编码的内容都应设置为相同的编码。最常见的是:

  • 将文档保存为UTF-8(或UTF8 w/o BOM)(如果您使用notepad++,它的格式->转换为UTF-8或UTF8 w/o BOM)
  • 在PHP和HTML的头应该设置为UTF-8
    • HTML: <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />,在您的文档的<head> -标签内。
    • PHP: header('Content-Type: text/html; charset=utf-8'); - PHP头必须在任何输出之前设置(没有HTML,没有空白,没有echo/print -什么都没有)。

还有其他方面可能需要设置为UTF-8,这取决于您使用的PHP函数类型等等。但以上通常是一个良好的开端。