我有一组从谷歌草图导出的坐标,上面有额外的绒毛,我一直试图用正则表达式剥离这些坐标。我认为从例如 SketchUp 快速获取 3D 图纸和 .xsi 文件非常有趣。在一个变量中是数据集的多个实例:
$str = 'SI_NurbsCurve 边缘1 { 1, 0, 0, 4, 0,0,1,1, 2, 870.243,1229.35,143.395,1 927.537,1323.53,103.842,1 } SI_NurbsCurve 边缘2 { 1, 0, 0, 4, 0,0,1,1, 2, 899.54,1217.88,116.255,1 870.243,1229.35,143.395,1 }';
我试图从多个实例中删除除坐标数据之外的所有内容,并使用此正则表达式:
$reg = '#SI_NurbsCurve Edge[^"]* { 1, 0, 0, 4, 0,0,1,1, 2,#'; $rep=";$str=preg_replace($reg,$rep,$str);
但是,这会导致仅回显字符串中找到的最后一个坐标集,在此示例中,将保留以下内容:
899.54,1217.88,116.255,1870.243,1229.35,143.395,1
除此之外,我正在尝试去除每行坐标上出现的最后一个数字"1",因此整个示例最终看起来像这样:
870.243,1229.35,143.395,927.537,1323.53,103.842,899.54,1217.88,116.255,870.243,1229.35,143.395,
我将非常感谢您的时间和专业知识!
您的第一个问题(仅获取最后一个值)可能是由以下原因引起的:
#SI_NurbsCurve Edge[^"]*
您将需要一个非贪婪的正则表达式,或者如果Edge
后面的值只是数字:
#SI_NurbsCurve Edge[0-9]*
之后,您可以切掉剩余每一行的最后两个字符。
您可能还需要转义{
字符:'{
并说明每组后的}
和空格/换行符,因此第一行应如下所示:
$str = '#('}'s+)?SI_NurbsCurve Edge[0-9]* '{
请参阅Codepad上的工作示例(每行的最后2个字符除外...)。
要同时删除每行末尾的剩余,1
,您可以通过以下方式更改preg_replace
行:
$str=preg_replace(array($reg, '#,1'r#'),array($rep,"'r"),$str);
这至少适用于 Codepad,但可能取决于换行符的编码。
你正在寻找$str = substr($str,0,-1)
无论如何,这不是一个完美的解决方案,但是,根据可用的测试数据,以下内容将返回所需的输出:
$str = 'SI_NurbsCurve Edge1 {
1,
0,
0,
4,
0,0,1,1,
2,
870.243,1229.35,143.395,1
927.537,1323.53,103.842,1
}
SI_NurbsCurve Edge2 {
1,
0,
0,
4,
0,0,1,1,
2,
899.54,1217.88,116.255,1
870.243,1229.35,143.395,1
}';
function stripExtra( $inElem ){
return !preg_match( '/^(?:(?:[0124](?:,0,1,1)?',)|(?:'})|(?:SI_NurbsCurve Edge.+ '{))$/' , $inElem );
}
$arr2 = array_filter( array_map( 'trim' , explode( "'n" , preg_replace( "/',1's+'n/" , ",'n" , $str ) ) ) , 'stripExtra' );
var_dump( $arr2 );
# Returns
# array(5) {
# [7]=>
# string(25) "870.243,1229.35,143.395,"
# [8]=>
# string(25) "927.537,1323.53,103.842,"
# [10]=>
# string(0) ""
# [18]=>
# string(24) "899.54,1217.88,116.255,"
# [19]=>
# string(25) "870.243,1229.35,143.395,"
# }
浏览解决方案...
function stripExtra( $inElem ){
return !preg_match( '/^(?:(?:[0124](?:,0,1,1)?',)|(?:'})|(?:SI_NurbsCurve Edge.+ '{))$/' , $inElem );
}
此函数将匹配呈现的字符串。根据提供的字符串是否与特定模式匹配,它将返回 true 或 false。这将使我们能够在稍后阶段删除不需要的行。此处使用的模式将与以下行匹配:
SI_NurbsCurve Edge1 {
0,
1,
2,
4,
0,0,1,1,
}
注意:仅当这些行没有一个或多个空格前缀时,它才会匹配这些行。但是,由于您的最终输出已经剥离了所有空间,因此这没什么大不了的。
因此,为了可读性,我将在这里将我的一行奇迹转移到多行中,以便我可以更好地解释它。
$arr2 = preg_replace( "/1's+'n/" , "'n" , $str );
这会根据要求将行尾的任何",1"实例替换为逗号。
$arr2 = explode( "'n" , $arr2 );
这将根据换行符拆分字符串,创建一个数组,每行形成一个新元素。
$arr2 = array_map( 'trim' , $arr2 );
这使用 array_map()
函数(PHP 文档)将trim()
函数(PHP 文档)应用于每个元素,从每个元素中删除任何前导和/或尾随空格。
$arr2 = array_filter( $arr2 , 'stripExtra' );
还记得我们上面写的那个函数吗?现在我们遍历数组,并测试每个元素。如果它们与上述行不匹配,则它们将保留在数组中。如果它们与上述不需要的行匹配,则该元素将从数组中删除。