如何为变量分配多字节字符串的前 3 行


How to assign a variable the first 3 lines of a multibyte string

我正在尝试获取一个多字节的希腊字符字符串并将其修剪为仅 3 行。我的方法是将多字节字符串拆分为一个字符数组,然后遍历它并尝试检测字符串中的换行符。但是,字符串根本没有被修剪,给了我一些奇怪的错误。

代码如下:

$break_count = 0;
            $char_array = array();
            $speech_string = ""; 
            $break_array = array();
            foreach($total_found as $speech)
            {   
                    $temp = preg_split('/(?<!^)(?!$)/u', $speech->speech_text );  
                    foreach($temp as $char){
                            if($char=="'n"){
                                    $break_count++;
                                    array_push($break_array,"LB");
                            }   
                            if($break_count < 4)
                            {   
                                    array_push($char_array,$char);
                            }else{  
                                    die(print_r(var_export($break_array) . " : " . $break_count,1));
                                    break;
                            }                               
                    }   
                    $string = join("",$char_array);
                    array_push($speech_array,$string);
                    $break_count = 0;
                    $loop_count++;
            }

$break_count 是我用来检测到目前为止遇到的换行次数的变量,当换行符超过 3 个时,字符应停止推送到 $char_array 变量。print_r应返回 4 个换行符和一个包含 4 个"LB"元素的数组。但是,它返回以下内容:数组 ( 0 => 'LB', 1 => 'LB', 2 => 'LB', 3 => 'LB', 4 => 'LB', 5 => 'LB', 6 => 'LB', 7 => 'LB', 8 => 'LB', ) : 4这意味着我的代码将更多的换行符推送到 $break_array 上,即使它应该在 $break_count = 4 之后脱离 4 循环。

任何帮助都非常感谢。

这能做到你想要的吗?

$allFirst3Lines = array();
foreach($total_found as $speech)
{
    $first3LinesArray = array_slice(explode("'n", $speech->speech_text), 0, 3);
    array_push($allFirst3Lines, implode("'n", $first3LinesArray));
}

如果多字节字符串另存为 UTF-8,则换行符与 ASCII 换行符二进制兼容。简单地通过常规换行符进行拆分是完全安全的,即使使用非多字节感知的标准函数也是如此。

$string = "これ'nは'nユーティーエッフエイト'nだぞ!";
echo join("'n", array_slice(explode("'n", $string), 0, 3));
> これ
> は
> ユーティーエッフエイト