我正在尝试从字符串中提取打包的十六进制数字。我的应用程序正在与服务器通信,该服务器发送一个带有标头的字符串,后跟 2 字节打包的十六进制数字。此字符串中有数千个数字。
我想做的是提取每个 2 字节的压缩数字,并将其转换为可用于执行计算的数字。
示例:string = "info:'x00'x00'x11'x11'x22'x22"
将生成三个数字0x0000
(十进制 0)、0x1111
(十进制 4369)、0x2222
(十进制 8738)
我有一个有效的解决方案(见下文),但是当我尝试处理服务器发送的数千个数字时,它的功能太慢了。请提供一些建议以加快我的方法。
//Works but is too slow!
//$string has the data from the server
$arrayIndex = 0;
for($index = [start of data]; $index < strlen($string); $index+=2){
$value = getNum($string, $index, $index+1);
$array[$arrayIndex++] = $value;
}
function getNum($string, $start, $end){
//get the substring we're interested in transforming
$builder = substr($string, $start, $end-$start+1);
//convert into hex string
$array = unpack("H*data", $builder);
$answer = $array["data"];
//return the value as a number
return hexdec($answer);
}
我也一直在尝试在单个解包命令中提取数字,但这不起作用(我在理解要使用的格式字符串时遇到了一些麻烦)
//Not working alternate method
//discard the header (in this case 18 bytes) and put the rest of the
//number values I'm interested in into an array
$unpacked = unpack("c18char/H2*data", $value);
for($i = 0; $i < $size; $i+=1){
$data = $unpacked["data".$i];
$array[$i] = $data;
}
$array = array();
$len = strlen($string);
for($index = [start of data]; $index < $len; $index+=2){
$d = unpack("H*data", substr($string, $index, 2));
$array[] = hexdec($d["data"]);
}
我所做的唯一重要的事情是缓存strlen的值并减少函数调用。
你也可以试试这个
foreach (str_split(substr($string, [start of data]), 2) as $chunk) {
$d = unpack("H*data", $chunk);
$array[] = hexdec($d["data"]);
}
我可以建议的一件事是通过引用传递包含数千个十六进制数的字符串,而不是值。如果有 3k 个数字,字符串是长 12k 个字符,3k 函数调用的倍数会导致 ~36M(如果每个字符使用一个字节,如果 utf8 则为 ~72M)堆栈上不必要的分配内存:
$arrayIndex = 0;
for($index = [start of data]; $index < strlen($string); $index+=2){
$value = getNum($string, $index, $index+1);
$array[$arrayIndex++] = $value;
}
//pass by reference rather than value
function getNum(&$string, $start, $end){
//get the substring we're interested in transforming
//$builder = substr($string, $start, $end-$start+1);
//not sure if substr takes reference or value, so implementing this way, just in case it's by value
$builder = $string[$start] . $string[$start + 1] ;
//convert into hex string
$array = unpack("H*data", $builder);
$answer = $array["data"];
//return the value as a number
return hexdec($answer);
}
不确定这加快了多少(肯定是内存分配),但绝对值得一试。
为什么不尝试这样的事情:
$string = "info:'x00'x00'x11'x11'x22'x22";
$ret = array();
preg_match_all('#''x('d{2})#', $string, $items);
if(isset($items[1]) && count($items[1])>0)
{
for($i=0;$i<count($items[1]);$i+=2)
{
if(isset($items[1][$i]) && isset($items[1][$i+1]))
{
$ret[] = '0x' . $items[1][$i] . $items[1][$i+1];
unset($items[1][$i]);
unset($items[1][$i+1]);
}
}
}