php的crc32的坑

 
更多

前几天写了一个分表程序,用的hash算法是crc32,分表的函数如下:

function _get_hash_table($station) {
    $str = crc32($station);
    debug($str);
    $hash = substr(abs($str), 0, 2);
    return 'table' . ($hash % 10);
}

首先在本地32位window机上生成好数据并插入对应的表中。但是再把程序和数据传到服务器上(64为linux),发现查不到数据。经过排查后发现,原来服务器上crc32的结果和本地不同。再查php手册才知,crc32的接口原来和机器有关。

php手册的描述:

Because PHP’s integer type is signed many crc32 checksums will result in negative integers on 32bit platforms. On 64bit installations all crc32() results will be positive integers though.

crc32返回的结果在32位机上会产生溢出,所以结果可能为负数。而在64位机上不会溢出,所以总是正值。

CRC算法是按字长位数bit进行计算的。

crc32函数会按照php中的两个常量参考计算 PHP_INT_SIZE,PHP_INT_MAX

这两个常量的定义:

整型数的字长和平台有关,尽管通常最大值是大约二十亿(32 位有符号)。PHP 不支持无符号整数。Integer值的字长可以用常量PHP_INT_SIZE来表示,自 PHP 4.4.0 和 PHP 5.0.5后,最大值可以用常量PHP_INT_MAX来表示。

输出下32位中PHP_INT_SIZE:4,PHP_INT_MAX:2147483647

输出下64位中PHP_INT_SIZE:8,PHP_INT_MAX:9223372036854775807

解决方法:

function _get_hash_table($station) {
    $checksum = crc32($station);
    //decbin($str);
    if (8 == PHP_INT_SIZE) {//64位机,进行移位从处理成和32机一样
        if ($checksum > 2147483647) {
            $checksum = $checksum & (2147483647);//对64位机的先进截取后32位
            $checksum = ~($checksum - 1);//取补码
            $checksum = $checksum & 2147483647;//由于补码操作的修改,但是这时的checksum是正值而不是负值
        }
    }
    debug($checksum . ':');
    $hash = substr(abs($checksum), 0, 2);//此处的abs是完全必要的
    return 'transit_dijkstra' . ($hash % 10);
}
打赏

本文固定链接: https://www.cxy163.net/archives/3298 | 绝缘体

该日志由 绝缘体.. 于 2019年12月09日 发表在 未分类 分类下, 你可以发表评论,并在保留原文地址及作者的情况下引用到你的网站或博客。
原创文章转载请注明: php的crc32的坑 | 绝缘体
关键字: , , , ,

php的crc32的坑:等您坐沙发呢!

发表评论


快捷键:Ctrl+Enter