PHP 删除字符串中的多个匹配项并合并其余项


PHP Remove multiple occurrences in string and merge the remaining

我有一组从谷歌草图导出的坐标,上面有额外的绒毛,我一直试图用正则表达式剥离这些坐标。我认为从例如 SketchUp 快速获取 3D 图纸和 .xsi 文件非常有趣。在一个变量中是数据集的多个实例:

$str = 'SI_NurbsCurve 边缘1 {        1,        0,        0,        4,        0,0,1,1,        2,        870.243,1229.35,143.395,1        927.537,1323.53,103.842,1        }        SI_NurbsCurve 边缘2 {        1,        0,        0,        4,        0,0,1,1,        2,        899.54,1217.88,116.255,1        870.243,1229.35,143.395,1        }';

我试图从多个实例中删除除坐标数据之外的所有内容,并使用此正则表达式:

$reg = '#SI_NurbsCurve Edge[^"]* {        1,        0,        0,        4,        0,0,1,1,        2,#'; $rep=";$str=preg_replace($reg,$rep,$str);

但是,这会导致仅回显字符串中找到的最后一个坐标集,在此示例中,将保留以下内容:

899.54,1217.88,116.255,1870.243,1229.35,143.395,1

除此之外,我正在尝试去除每行坐标上出现的最后一个数字"1",因此整个示例最终看起来像这样:

870.243,1229.35,143.395,927.537,1323.53,103.842,899.54,1217.88,116.255,870.243,1229.35,143.395,

我将非常感谢您的时间和专业知识!

您的第一个问题(仅获取最后一个值)可能是由以下原因引起的:

#SI_NurbsCurve Edge[^"]*

您将需要一个非贪婪的正则表达式,或者如果Edge后面的值只是数字:

#SI_NurbsCurve Edge[0-9]*

之后,您可以切掉剩余每一行的最后两个字符。

您可能还需要转义{字符:'{并说明每组后的}和空格/换行符,因此第一行应如下所示:

$str = '#('}'s+)?SI_NurbsCurve Edge[0-9]* '{

请参阅Codepad上的工作示例(每行的最后2个字符除外...)。

要同时删除每行末尾的剩余,1,您可以通过以下方式更改preg_replace行:

$str=preg_replace(array($reg, '#,1'r#'),array($rep,"'r"),$str);

这至少适用于 Codepad,但可能取决于换行符的编码。

我想

你正在寻找$str = substr($str,0,-1)

无论如何,这不是一个完美的解决方案,但是,根据可用的测试数据,以下内容将返回所需的输出:

$str = 'SI_NurbsCurve Edge1 {
        1,
        0,
        0,
        4,
        0,0,1,1,
        2,
        870.243,1229.35,143.395,1
        927.537,1323.53,103.842,1
        }
        SI_NurbsCurve Edge2 {
        1,
        0,
        0,
        4,
        0,0,1,1,
        2,
        899.54,1217.88,116.255,1
        870.243,1229.35,143.395,1
        }';
function stripExtra( $inElem ){
  return !preg_match( '/^(?:(?:[0124](?:,0,1,1)?',)|(?:'})|(?:SI_NurbsCurve Edge.+ '{))$/' , $inElem );
}
$arr2 = array_filter( array_map( 'trim' , explode( "'n" , preg_replace( "/',1's+'n/" , ",'n" , $str ) ) ) , 'stripExtra' );
var_dump( $arr2 );
# Returns
# array(5) {
#   [7]=>
#   string(25) "870.243,1229.35,143.395,"
#   [8]=>
#   string(25) "927.537,1323.53,103.842,"
#   [10]=>
#   string(0) ""
#   [18]=>
#   string(24) "899.54,1217.88,116.255,"
#   [19]=>
#   string(25) "870.243,1229.35,143.395,"
# }

浏览解决方案...

function stripExtra( $inElem ){
  return !preg_match( '/^(?:(?:[0124](?:,0,1,1)?',)|(?:'})|(?:SI_NurbsCurve Edge.+ '{))$/' , $inElem );
}

此函数将匹配呈现的字符串。根据提供的字符串是否与特定模式匹配,它将返回 true 或 false。这将使我们能够在稍后阶段删除不需要的行。此处使用的模式将与以下行匹配:

SI_NurbsCurve Edge1 {
0,
1,
2,
4,
0,0,1,1,
}

注意:仅当这些行没有一个或多个空格前缀时,它才会匹配这些行。但是,由于您的最终输出已经剥离了所有空间,因此这没什么大不了的。

因此,为了可读性,我将在这里将我的一行奇迹转移到多行中,以便我可以更好地解释它。

$arr2 = preg_replace( "/1's+'n/" , "'n" , $str );

这会根据要求将行尾的任何",1"实例替换为逗号。

$arr2 = explode( "'n" , $arr2 );

这将根据换行符拆分字符串,创建一个数组,每行形成一个新元素。

$arr2 = array_map( 'trim' , $arr2 );
这使用 array_map() 函数(PHP 文档)

trim()函数(PHP 文档)应用于每个元素,从每个元素中删除任何前导和/或尾随空格。

$arr2 = array_filter( $arr2 , 'stripExtra' );

还记得我们上面写的那个函数吗?现在我们遍历数组,并测试每个元素。如果它们与上述行不匹配,则它们将保留在数组中。如果它们与上述不需要的行匹配,则该元素将从数组中删除。