DeTechn Blog

有10亿条订单数据,属于1000个司机的,请取出订单量前20的司机

思路: 
1、先顺序读取10亿条数据,统计每个司机各点多少订单量
2、构建一个最大堆,顺序过滤1000个司机,找到前20个司机
伪代码:
$order_data = [];
foreach(10亿条订单 as $order_info) {
    if(isset($order_data[$order_info]) {
        $order_data[$order_info] ++;
    } else {
        $order_data[$order_info] = 1;
    }
}

$map = [];
foreach ($order_data as $num) {
    if (count($map) < 20) {
        $map[] = $num;
        continue;
    }
    $min = min($map);
    if ($num > $min) {
        for ($i = 0; $i < count($map); ++$i) {
            if ($map[$i] == $min) {
                $map[$i] = $num;    //将最小值替换
                break;  //跳出循环,只替换一次
            }
        }
    }
}

当前页面是本站的「Google AMP」版。查看和发表评论请点击:完整版 »