CRC32 Hash PK Murmur Hash「建议收藏」

CRC32 Hash PK Murmur Hash「建议收藏」硬件指令实现的CRC32运算在多款主流CPU上性能超越Murmurhash,碰撞性能基本一致,多数场景可以使用CRC32硬件指令优化HASH算法提升性能

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

     murmurhash是一种高性能、低碰撞率的非加密hash算法本测试采用版本为urmurhash2;硬件加速crc32 hash需要CPU支持SSE4.2指令集,市面上绝大部分CPU已支持,具体可检查你所使用的CPUflags


  murmurhash2的代码实现

uint32_t MurmurHash2 ( const void * key, int len, uint32_t seed )
{
  // 'm' and 'r' are mixing constants generated offline.
  // They're not really 'magic', they just happen to work well.

  const uint32_t m = 0x5bd1e995;
  const int r = 24;

  // Initialize the hash to a 'random' value

  uint32_t h = seed ^ len;

  // Mix 4 bytes at a time into the hash

  const unsigned char * data = (const unsigned char *)key;

  while(len >= 4)
  {
    uint32_t k = *(uint32_t*)data;

    k *= m;
    k ^= k >> r;
    k *= m;

    h *= m;
    h ^= k;

    data += 4;
    len -= 4;
  }

  // Handle the last few bytes of the input array

  switch(len)
  {
  case 3: h ^= data[2] << 16;
  case 2: h ^= data[1] << 8;
  case 1: h ^= data[0];
      h *= m;
  };

  // Do a few final mixes of the hash to ensure the last few
  // bytes are well-incorporated.

  h ^= h >> 13;
  h *= m;
  h ^= h >> 15;

  return h;
} 

  crc32代码实现

static inline uint32_tcrc32c_sse42_u8(uint8_t data, uint32_t init_val){	__asm__ volatile(			"crc32b %[data], %[init_val];"			: [init_val] "+r" (init_val)			: [data] "rm" (data));	return init_val;}static inline uint32_tcrc32c_sse42_u16(uint16_t data, uint32_t init_val){	__asm__ volatile(			"crc32w %[data], %[init_val];"			: [init_val] "+r" (init_val)			: [data] "rm" (data));	return init_val;}static inline uint32_tcrc32c_sse42_u32(uint32_t data, uint32_t init_val){	__asm__ volatile(			"crc32l %[data], %[init_val];"			: [init_val] "+r" (init_val)			: [data] "rm" (data));	return init_val;}static inline uint32_thash_crc(const void *data, uint32_t data_len, uint32_t init_val){	unsigned i;	uintptr_t pd = (uintptr_t) data;	for (i = 0; i < data_len / 8; i++) {		init_val = crc32c_sse42_u8(*(const uint64_t *)pd, init_val);		pd += 8;	}	if (data_len & 0x4) {		init_val = crc32c_sse42_u32(*(const uint32_t *)pd, init_val);		pd += 4;	}	if (data_len & 0x2) {		init_val = crc32c_sse42_u16(*(const uint16_t *)pd, init_val);		pd += 2;	}	if (data_len & 0x1)		init_val = crc32c_sse42_u8(*(const uint8_t *)pd, init_val);	return init_val;}

              测试代码实现

std::set<int> g_knocked_set;uint32_t g_spare_range = 0;static inline uint64_trdtsc(void){    unsigned long long ret;    __asm__ __volatile__("rdtsc" : "=A" (ret));    return ret;}void printHelp(const char *progname) {    printf("%s\n\n", progname);    printf("-h            Print this help\n");    printf("-f <file>     File name\n");    printf("-m <mode>     1:murmur 2:crc -1:murmur_knocked -2:crc_knocked\n");    exit(0);}static inline void crc_hash(std::string &s) {    hash_crc(s.c_str(), s.size(), 16);}static inline void knocked_crc_hash(std::string &s) {    uint32_t h = hash_crc(s.c_str(), s.size(), 16);    g_knocked_set.insert(h % g_spare_range);}static inline void murmur_hash2(std::string &s) {    MurmurHash2(s.c_str(), s.size(), 16);}static inline void knocked_murmur_hash2(std::string &s) {    uint32_t h = MurmurHash2(s.c_str(), s.size(), 16);    g_knocked_set.insert(h % g_spare_range);}int main(int argc, char* argv[]){    char c, buf[1024];    char *fname = NULL;    FILE *file = NULL;    std::list<std::string> patterns;    uint64_t tbegin, tend;    int mode = 1;        while ((c = getopt(argc,argv,"f:hm:")) != -1) {        switch (c) {            case 'h':                printHelp(argv[0]);                break;            case 'f':                fname = strdup(optarg);                break;            case 'm':                mode = atoi(optarg);                break;        }    }    if (!fname) {        printHelp(argv[0]);    }    file = fopen(fname, "r");    if ( !file) {        printf("fname[%s] open error.\n", fname);        exit(-1);    }    while(fgets(buf, 1024, file) != NULL) {//        printf("%s", buf);        std::string s(buf);        patterns.push_back(s);    }    g_spare_range = patterns.size();    if (mode == 1) {        tbegin = rdtsc();        std::for_each(patterns.begin(), patterns.end(), murmur_hash2);        tend = rdtsc();        printf("[murmur]    %u\n", tend - tbegin);    }        if (mode == 2) {        tbegin = rdtsc();        std::for_each(patterns.begin(), patterns.end(), crc_hash);        tend = rdtsc();        printf("[crc]   %u\n", tend - tbegin);    }    if (mode == -1) {        std::for_each(patterns.begin(), patterns.end(), knocked_murmur_hash2);        printf("[murmur]    %f\n", g_knocked_set.size()/(g_spare_range * 1.0));    }    if (mode == -2) {        std::for_each(patterns.begin(), patterns.end(), knocked_crc_hash);        printf("[crc]    %f\n", g_knocked_set.size()/(g_spare_range * 1.0));    }    return 0;}

       

测试方法:

        存在一定测试误差,包含了遍历SET的时间,可能收到内存读取效率的影响,严格测试应该考虑到这些因素,每个测试用例测试100次,取算数平均值,参考标准方差,后续可以对测试做一定优化排除各类干扰,因此,本测试只做算法间的效率横向对比,不做某个算法绝对速率参考,评估时间单位使用clock,一个clock=1/CPU频率(秒)

        1、1000条16字节随机字符串测试

CRC32 Hash PK Murmur Hash「建议收藏」

        2、1000条64字节随机字符串测试

CRC32 Hash PK Murmur Hash「建议收藏」

        3、1000条128字节随机字符串测试

CRC32 Hash PK Murmur Hash「建议收藏」

         4、相同CPU不同长度随机字符串测试

CRC32 Hash PK Murmur Hash「建议收藏」

图示直观~~

CRC32 Hash PK Murmur Hash「建议收藏」
CRC32 Hash PK Murmur Hash「建议收藏」

由此可见,硬件指令实现的CRC32运算在多款主流CPU上性能超越Murmurhash,碰撞性能基本一致,多数场景可以使用CRC32硬件指令优化HASH算法提升性能。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/183553.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Java中使用OpenSSL生成的RSA公私钥进行数据加解密「建议收藏」

    Java中使用OpenSSL生成的RSA公私钥进行数据加解密「建议收藏」本文出处:http://blog.csdn.net/chaijunkun/article/details/7275632,转载请注明。由于本人不定期会整理相关博文,会对相应内容作出完善。因此强烈建议在原始出处查看此文。RSA是什么:RSA公钥加密算法是1977年由RonRivest、AdiShamirh和LenAdleman在(美国麻省理工学院)开发的。RSA取名来自开发他们三

    2022年6月6日
    38
  • ubuntu安装pycharm快捷图标_pycharm快捷方式找不到了

    ubuntu安装pycharm快捷图标_pycharm快捷方式找不到了1、首先下载pycharm安装包,从官网下载,选择专业版。2、解压到一个文件夹,打开bin文件夹,命令行下运行pycharm.sh文件。sh./pycharm.sh3、然后出现安装过程,一步一步走下去就行,如果中间问是否需要加载以前的设置(如果以前安装过),可以加也可以不加。4、激活码选择企业版,可以输入:http://idea.imsxm.com/5、完成安装。但是这样每次打开pycharm,需

    2022年8月26日
    8
  • 各种数据库的分页查询语句[通俗易懂]

    各种数据库的分页查询语句

    2022年3月2日
    48
  • 程序员去外包公司有前途吗_程序员去外包是不是就废了

    程序员去外包公司有前途吗_程序员去外包是不是就废了虽然大部分人都抵制外包,但是很多人,尤其是萌新,并不清楚外包的主要缺点。我这里简单说一下。程序员去外包公司有前途吗?不能说去了外包公司就完全没有前途了,主要看个人能力,外包的工作内容,大多十分碎片化,甚至是机械化。因为如果这个工作内容真的很完整、成块儿,那正式工就做掉了。正式工做掉的理由有两个:完整工作内容有利于他,去构建业务认知。完整内容拆分出来外包,需要进行进行大量的沟通与团队协作,不利于整体效率。那么有没有办法避免碎片化呢?答案是有的。一方面可以表现出自身能力,获取正式团队

    2022年9月30日
    7
  • MIPI协议(上)

    MIPI协议(上)一、MIPIMIPI(移动行业处理器接口)是MobileIndustryProcessorInterface的缩写。MIPI(移动行业处理器接口)是MIPI联盟发起的为移动应用处理器制定的开放标准。已经完成和正在计划中的规范如下: 二、MIPI联盟的MIPIDSI规范1、名词解释•DCS(DisplayCommandSet):DCS是一个标准化的命令集,用于…

    2022年4月29日
    93
  • c#(asp.net)杂谈笔记

    c#(asp.net)杂谈笔记

    2021年6月20日
    97

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号