我有一个数组,使用php,我需要从这个数组中删除"listingCode"上的所有非重复项。例如:
Array
(
[0] => Array
(
[name] => Supplier A
[listingCode] => ABC
)
[1] => Array
(
[name] => Supplier B
[listingCode] => ABC
)
[2] => Array
(
[name] => Supplier B
[listingCode] => DEF
)
[3] => Array
(
[name] => Supplier C
[listingCode] => XYZ
)
[4] => Array
(
[name] => Supplier D
[listingCode] => BBB
)
[5] => Array
(
[name] => Supplier E
[listingCode] => ABCDEF
)
[6] => Array
(
[name] => Supplier F
[listingCode] => ABCDEF
)
)
我在这个数组中有120万条记录。基本上,当一切都说了算,我只想在数组中留下元素0、1、5、6。这可能吗?
基本上所有这些数据都来自3个表。我只想显示任何列出的代码可能重复的供应商。例如,列出代码1,2,6,7是重复的,因此显示供应商A、B、E、F
Supplier
----------------------
ID| Supplier Name
1 | Supplier A
2 | Supplier B
3 | Supplier B
4 | Supplier C
5 | Supplier D
6 | Supplier E
7 | Supplier F
Product
----------------------
ID| Product Name | Supplier ID
1 | ABC | 1
2 | DEF | 2
3 | GHI | 3
4 | JKL | 4
5 | MNO | 5
6 | PQR | 6
7 | STU | 7
Listing
----------------------
ID| Listing Code | Product ID
1 | ABC | 1
2 | ABC | 2
3 | DEF | 3
4 | XYZ | 4
5 | BBB | 5
6 | ABCDEF | 6
7 | ABCDEF | 7
感谢
array_filter()是一个标准的PHP函数,允许您根据回调条件返回数组值的子集
$data = [
['name' => 'Supplier A', 'productName' => 'ABC'],
['name' => 'Supplier B', 'productName' => 'ABC'],
['name' => 'Supplier B', 'productName' => 'DEF'],
['name' => 'Supplier C', 'productName' => 'XYZ'],
['name' => 'Supplier D', 'productName' => 'BBB'],
['name' => 'Supplier E', 'productName' => 'ABCDEF'],
['name' => 'Supplier F', 'productName' => 'ABCDEF']
];
$result = array_filter(
$data,
function($value) use ($data) {
return count(array_filter(
$data,
function ($match) use ($value) {
return $match['productName'] === $value['productName'];
}
)) > 1;
}
);
var_dump($result);
这依次循环通过每个数组元素,执行一个回调,该回调计算原始数组中有多少重复项(基于productName
),如果有多个匹配记录,则返回一个true
,指示在过滤后应保留该记录
是的,它确实保留了原始密钥
然而,一个有120万条记录的数组占用了PHP宝贵的内存,而且对于如此大的数据量,过滤速度会非常慢。。。。通过SQL实现这一点要好得多。
这并不能完全回答您的问题,但我决定尝试提供一种替代方法,以生成更可用的数据结构。
foreach ($supplier_products as $item) {
$products[$item['productName']][] = $item['name'];
}
这将生成一个数组,其中产品名称作为关键字,每个产品名称的供应商数组作为值。然后,如果你只想要有多个供应商的产品,你可以在数组过滤器中计算供应商:
$duplicate_products = array_filter($products, function($product) {
return count($product) > 1;
});
这将导致一个数组,如:
Array (
[ABC] => Array (
[0] => Supplier A
[1] => Supplier B
)
[ABCDEF] => Array (
[0] => Supplier E
[1] => Supplier F
)
)
当然,这并不是你所要求的,但在我看来会更容易处理。
在您编辑后,我认为此查询将为您提供一份具有重复列表代码的供应商列表:
SELECT
s.supplier_name
FROM
listing l1
INNER JOIN listing l2 ON l1.listing_code = l2.listing_code AND l1.id != l2.id
INNER JOIN product p ON l1.product_id = p.id
INNER JOIN supplier s on p.supplier_id = s.id
GROUP BY
s.supplier_name