从Array php中删除所有非重复项


Remove all non duplicates from Array php

我有一个数组,使用php,我需要从这个数组中删除"listingCode"上的所有非重复项。例如:

Array
(
    [0] => Array
    (
        [name] => Supplier A
        [listingCode] => ABC
    )
    [1] => Array
    (
        [name] => Supplier B
        [listingCode] => ABC
    )
    [2] => Array
    (
        [name] => Supplier B
        [listingCode] => DEF
    )
    [3] => Array
    (
        [name] => Supplier C
        [listingCode] => XYZ
    )
    [4] => Array
    (
        [name] => Supplier D
        [listingCode] => BBB
    )
    [5] => Array
    (
        [name] => Supplier E
        [listingCode] => ABCDEF
    )
    [6] => Array
    (
        [name] => Supplier F
        [listingCode] => ABCDEF
    )
)

我在这个数组中有120万条记录。基本上,当一切都说了算,我只想在数组中留下元素0、1、5、6。这可能吗?

基本上所有这些数据都来自3个表。我只想显示任何列出的代码可能重复的供应商。例如,列出代码1,2,6,7是重复的,因此显示供应商A、B、E、F

Supplier
----------------------
ID| Supplier Name
1 | Supplier A
2 | Supplier B
3 | Supplier B
4 | Supplier C
5 | Supplier D
6 | Supplier E
7 | Supplier F
Product
----------------------
ID| Product Name | Supplier ID
1 | ABC          | 1
2 | DEF          | 2
3 | GHI          | 3
4 | JKL          | 4
5 | MNO          | 5
6 | PQR          | 6 
7 | STU          | 7
Listing
----------------------
ID| Listing Code | Product ID
1 | ABC          | 1
2 | ABC          | 2
3 | DEF          | 3
4 | XYZ          | 4
5 | BBB          | 5
6 | ABCDEF       | 6 
7 | ABCDEF       | 7

感谢

array_filter()是一个标准的PHP函数,允许您根据回调条件返回数组值的子集

$data = [
    ['name' => 'Supplier A', 'productName' => 'ABC'],
    ['name' => 'Supplier B', 'productName' => 'ABC'],
    ['name' => 'Supplier B', 'productName' => 'DEF'],
    ['name' => 'Supplier C', 'productName' => 'XYZ'],
    ['name' => 'Supplier D', 'productName' => 'BBB'],
    ['name' => 'Supplier E', 'productName' => 'ABCDEF'],
    ['name' => 'Supplier F', 'productName' => 'ABCDEF']
];
$result = array_filter(
    $data,
    function($value) use ($data) {
        return count(array_filter(
            $data,
            function ($match) use ($value) {
                return $match['productName'] === $value['productName'];
            }
        )) > 1;
    }
);
var_dump($result);

这依次循环通过每个数组元素,执行一个回调,该回调计算原始数组中有多少重复项(基于productName),如果有多个匹配记录,则返回一个true,指示在过滤后应保留该记录

是的,它确实保留了原始密钥


然而,一个有120万条记录的数组占用了PHP宝贵的内存,而且对于如此大的数据量,过滤速度会非常慢。。。。通过SQL实现这一点要好得多。

这并不能完全回答您的问题,但我决定尝试提供一种替代方法,以生成更可用的数据结构。

foreach ($supplier_products as $item) {
    $products[$item['productName']][] = $item['name'];
}

这将生成一个数组,其中产品名称作为关键字,每个产品名称的供应商数组作为值。然后,如果你只想要有多个供应商的产品,你可以在数组过滤器中计算供应商:

$duplicate_products = array_filter($products, function($product) {
    return count($product) > 1; 
});

这将导致一个数组,如:

Array ( 
    [ABC] => Array ( 
        [0] => Supplier A 
        [1] => Supplier B 
    )
    [ABCDEF] => Array (
        [0] => Supplier E 
        [1] => Supplier F
    )
)

当然,这并不是你所要求的,但在我看来会更容易处理。


在您编辑后,我认为此查询将为您提供一份具有重复列表代码的供应商列表:

SELECT
    s.supplier_name
FROM
    listing l1 
    INNER JOIN listing l2 ON l1.listing_code = l2.listing_code AND  l1.id != l2.id
    INNER JOIN product p ON l1.product_id = p.id
    INNER JOIN supplier s on p.supplier_id = s.id
GROUP BY
    s.supplier_name