将字符串拆分为数组正则表达式 php


Split string into array regex php

我需要将下面的字符串拆分为数组键,如下所示:

字符串 = "(731) some text here with number 2 (220) some 54 number other text here"转换为:

array( 
  '731' => 'some text here with number 2', 
  '220' => 'some 54 number other text here' 
);

我试过:

preg_split( '/'([0-9]{3}')/', $string ); 

并得到:

array ( 
  0 => 'some text here', 
  1 => 'some other text here' 
); 

代码

$string = "(731) some text here with number 2 (220) some 54 number other text here";
preg_match_all("/'(('d{3})') *([^( ]*(?> +[^( ]+)*)/", $string, $matches);
$result = array_combine($matches[1], $matches[2]);
var_dump($result);

输出

array(2) {
  [731]=>
  string(28) "some text here with number 2"
  [220]=>
  string(30) "some 54 number other text here"
}

IDEe演示


描述

正则表达式使用

  • '(('d{3})')匹配括号中的 3 位数字并捕获它(第 1 组(
  • ' *匹配键和值之间的空格
  • ([^( ]*(?> +[^( ]+)*)匹配除(以外的所有内容并捕获它(第 2 组(
    此子模式与[^(]*(?<! )完全相同,但基于展开循环技术更有效。

    *请注意,虽然我正在解释的值字段不能包含(。如果不是这种情况,请告知,我会相应地修改它。

之后,我们用键$matches[1],用值$matches[2]。使用array_combine()我们生成所需的数组。

试试这个:

$string = "(731) some text here with number 2 (220) some 54 number other text here";
$a = preg_split('/'s(?='()/', $string);//split by spaces preceding the left bracket
$res = array();
foreach($a as $v){
    $r = preg_split('/(?<='))'s/', $v);//split by spaces following the right bracket
    if(isset($r[0]) && isset($r[1])){
        $res[trim($r[0],'() ')] = trim($r[1]);//trim brackets and spaces
    }
}
print_r($res);

输出:

Array
(
    [731] => some text here with number 2
    [220] => some 54 number other text here
)

演示

如果您只想将其限制为括号中具有 3 位数字的数字,只需修改环视:

$a = preg_split('/'s(?='([0-9]{3}'))/', $string);

你可以试试这个,

<?php
$str="(731) some text here (220) some other text here";
echo $str .'<br>';
$arr1=explode('(', $str);
$size_arr=count($arr1);
$final_arr=array();
for($i=1;$i<$size_arr; $i++){
    $arr2=explode(')', $arr1[$i]);
    $final_arr[$arr2[0]]=trim($arr2[1]);
}
echo '<pre>';
print_r($final_arr);
?>

使用此链接测试代码,请单击此处。

我尝试使用简单的语法。希望大家能理解。

我很确定定义键是不可能的,因为正则表达式会连续添加匹配项。我会定义 2 个正则表达式,一个用于钥匙:

preg_match_all("/('()([0-9]*)('))'s/", $input_lines, $output_array);

你可以在 $output_array[2] 中找到你的密钥。还有一个用于文本(看起来完全一样(:

preg_split("/('()([0-9]*)('))'s/", $input_line);

之后,您可以构建自定义数组来迭代两者。确保在插入时修剪第二个数组中的字符串。

使用preg_replace_callback()您可以快速实现您想要的内容(当只有括号包含 3 位数字时(:

$string = "(731) some text here with number 2 (220) some 54 number other text here";
$array = array();
preg_replace_callback('~('(('d{3})'))(.*?)(?=(?1)|'Z)~s', function($match) use (&$array) {
    $array[$match[2]] = trim($match[3]);
}, $string);
var_dump($array);

输出:

array(2) {
  [731]=>
  string(28) "some text here with number 2"
  [220]=>
  string(30) "some 54 number other text here"
}

也许您可以将PREG_SPLIT_DELIM_CAPTURE标志添加到preg_split.从preg_split手册页 (http://php.net/manual/en/function.preg-split.php(

PREG_SPLIT_DELIM_CAPTURE

如果设置了此标志,则还将捕获并返回分隔符模式中的括号表达式。

因此,如果您将代码更改为:

$results = preg_split('/'(([0-9]+)')/s', $data,null,PREG_SPLIT_DELIM_CAPTURE);

您将获得类似于以下内容的数组:

Array
(
    [0] => KS/M/ 2013/1238 
    [1] => 220
    [2] =>  23/12/2013 
    [3] => 300
    [4] => 
    [5] => 731
    [6] =>  VALDETE BUZA ADEM JASHARI- PRIZREN, KS 
    [7] => 526
    [8] => 
    [9] => 591
    [10] => 
    [11] => 740
    [12] => 

    [13] => 540
    [14] =>  DEINA 
    [15] => 546
    [16] => 

    [17] => 511
    [18] =>  3 Preparatet për zbardhim dhe substancat tjera për larje rrobash; preparatet për pastrim, shkëlqim, fërkim dhe gërryerje; sapunët; parfumet, vajrat esencialë, preparatet kozmetike, losionet për flokë, pasta për dhembe
14 Metalet e cmueshme dhe aliazhet e tyre; mallrat në metale të cmueshme ose të veshura me to, që nuk janë përfshire në klasat tjera; xhevahirët, gurët e cmueshëm; instrumentet horologjike dhe kronometrike (për matjen dhe regjistrimin e kohës)
25 Rrobat, këpucët, kapelat
35 Reklamim, menaxhim biznesi; administrim biznesi; funksione zyre
)

在这种情况下,您应该做的是遍历数组,忽略第一个元素:

$myArray = array();
$myKey = '';
foreach ($results as $k => $v) {
  if ( ($k > 0) && ($myKey == '')) {
    $myKey = $v;
  } else if ($k > 0) {
    $myArray[$myKey] = $v; 
    $myKey = '';
  }
}

编辑:这个答案是针对:

$data ='KS/M/ 2013/1238 (220) 23/12/2013 (300)
(731) VALDETE BUZA ADEM JASHARI- PRIZREN, KS (526)
(591)
(740)
(540) DEINA (546)
(511) 3 Preparatet për zbardhim dhe substancat tjera për larje rrobash; preparatet për pastrim, shkëlqim, fërkim dhe gërryerje; sapunët; parfumet, vajrat esencialë, preparatet kozmetike, losionet për flokë, pasta për dhembe
14 Metalet e cmueshme dhe aliazhet e tyre; mallrat në metale të cmueshme ose të veshura me to, që nuk janë përfshire në klasat tjera; xhevahirët, gurët e cmueshëm; instrumentet horologjike dhe kronometrike (për matjen dhe regjistrimin e kohës)
25 Rrobat, këpucët, kapelat
35 Reklamim, menaxhim biznesi; administrim biznesi; funksione zyre';