使用多个分隔符拆分字符串


Split string with multiple delimiters

关于如何做到这一点,我已经见过很多(在您将其标记为重复之前),但由于某种原因,我的输出不工作:

// $delimiters wanted: ', ' | '; ' | ',' | ';' | ' , ' | ', and ' | ' and ' | ',and '
$str = 'Name 1, Name 2; Name 3;Name4 , Name 5,Name 6, and Name 7,and Name 8 and Name 9';
$delimiter = array(
    ', ',
    '; ',
    ';',
    ',',
    ' , ',
    ', and ',
    ' and ',
    ',and '
);
$str_new = explode( $delimiter[0], str_replace($delimiter, $delimiter[0], $str) );

然而,当我输出数组时,我得到了这个:

<?php foreach($str_new as $new) { echo 'a' . $new; } ?>
Array (
    [0] => Name 1
    [1] => Name 2
    [2] => Name 3
    [3] =>        // WHY IS THIS EMPTY?
    [4] => Name 4
    ...
)

那么是否有更好的方法来匹配我列出的分隔符呢?

我会在您的情况下使用这样的regexp:

preg_split('/,? ?and | ?[,;] ?/', $str)

如果出现其他空格字符(例如TAB),您可能还需要将空格替换为's,或者甚至将's*替换为?,以覆盖多个空格的情况。

你试过从php.net这样做吗?

<?php
//$delimiters has to be array
//$string has to be array
function multiexplode ($delimiters,$string) {
    $ready = str_replace($delimiters, $delimiters[0], $string);
    $launch = explode($delimiters[0], $ready);
    return  $launch;
}
$text = "here is a sample: this text, and this will be exploded. this also | this one too :)";
$exploded = multiexplode(array(",",".","|",":"),$text);
print_r($exploded);
?>

或者PHP中按多分隔符分割字符串

在您的代码中,在Name 6, and Name 7之间,首先替换,,然后替换and

因此你最终得到这个字符串:

名称1、名称2、名称3、名称4、名称5、名称6、名称7、名称8、名称9

因此,空值…

在输出之前清理你的结果数组,你应该没问题:

$str_out = array_filter($str_new);

您的方法中的问题是,您想使用错误的方法来解决问题。即使你设法创建了一个分隔符列表,如果你需要用另一个字符分隔单词,比如一个'$'符号,会发生什么呢?

你应该实现一个标记器/词法分析器,它一个字符一个字符地读取输入,并区分空白,终端和非终端符号/字符。然后词法分析器将生成一个令牌序列,例如

STRING-SYMBOL:'NAME1' 
KOMMA-SYMBOL 
AND-SYMBOL 
STRING-SYMBOL:'NAME2' 
SEMICOLON-SYMBOL 
STRING-SYMBOL:'NAME3' 
AND-SYMBOL
...
EOF-SYMBOL

然后您只需过滤掉任何非STRING-SYMBOL符号(或者您使用AND-SYMBOL组合字符串)。这是(恕我直言)唯一坚如磐石的解决方案。它也很容易扩展和一般化:一旦您编写了一个很好的标记器/词法分析器,您就可以使用这种方法来处理几乎任何字符串分析问题。

编写标记器通常非常简单:它逐个字符扫描输入并首先对字符进行分类。它实现了一个简单的状态机来收集将形成符号的字符。

您可以尝试使用正则表达式来实现这一点,这也是可能的。无论如何,标记器将生成一个标记列表(或者根据请求检索下一个标记)。它将检索的最后一个令牌是EOF-TOKEN,表示输入序列已被完全遍历。