来源: 利用redis实现多属性快速查询 – SegmentFault 思否
前言
拿京东举例,如下图
我们要找一款电子琴,牌子有:雅马哈、卡西欧,价格有各种区间,各种颜色、不同的音色数。
现如今动不动就得整点高并发啥的,直接用mySQL我们是不是真的扛不住?在前面加一层cache?怎么加?各种属性的组合存到一个属性组合成的key中?如何相对实时的更新属性?
之前的文章我有介绍过redis
中setbit
和bitop
的使用方法,就是将某一位标记为1或者0代表存在不存在,然后利用bitop
进行AND
或者OR
计算,得到我们想要的结果,今天我们就从零开始打造一个“高性能”的属性筛选器!
按属性储存数据
假设现在我们有三款电子琴,一款雅马哈、两款卡西欧,具体的属性表格为:
ID | 品牌 | 颜色 | 价格 | 音色 |
---|---|---|---|---|
1 | 雅马哈 | 红色 | 1000 | 100 |
2 | 卡西欧 | 黑色 | 2000 | 150 |
3 | 卡西欧 | 白色 | 2000 | 200 |
我们将属性+属性值组合为key,ID为对应的某位偏移量,这样使用下面的语句初始化数据到redis
//初始化品牌
$redis->setBit('brand-雅马哈', 1, 1);
$redis->setBit('brand-卡西欧', 2, 1);
$redis->setBit('brand-卡西欧', 3, 1);
//初始化颜色
$redis->setBit('color-红色', 1, 1);
$redis->setBit('color-黑色', 2, 1);
$redis->setBit('color-白色', 3, 1);
//初始化价格
$redis->setBit('price-1000', 1, 1);
$redis->setBit('price-2000', 2, 1);
$redis->setBit('price-2000', 3, 1);
......
随意组合属性筛选
我想要搜一下,2000元的白色卡西欧,只需要这样
$redis->bitop('AND', 'cacheKey', 'brand-卡西欧', 'color-白色');
$redis->bitop('AND', 'cacheKey1', 'cacheKey', 'price-2000');
结果cacheKey1的二进制形式为001
,这样我们就知道搜索的结果是ID为3的商品。
然而redis并没有提供查询哪些位位1的方法,我们只能通过get方法将内容获取出来,自己处理。提供一段参考代码:
$bit = $redis->get($cacheKey);
$bitLength = strlen($bit);
//redis返回的数据长度可能不是8的倍数,为了方便解包,我们将它补齐
while($bitLength % 8 != 0) {
$bitLength++;
}
$bit = str_pad($bit, $bitLength, pack('N', 0));
$bit = unpack('N*', $bit);
$bit = array_filter($bit);
$ids = [];
foreach($bit as $k => $b) {
$bitPos = [];
while($b) {
$bin = sprintf('%032s', decbin($b));
$bitPos[] = strrpos($bin, '1');
$b &= ($b - 1);
}
foreach($bitPos as $pos) {
$ids[] = ($k - 1) * 32 + $pos;
}
}
我在本地试了一下,20W的数据(单个属性-属性值redis占用大概24k),同时搜索4个属性只需要不到10ms,当然现实中肯定没这么理想,但效果一定不会太差。
优化setbit
如果商品和属性过多,对redis的写入压力是相当大的(商品数属性数属性值数的写入数),我们可以先自行组合成字符串,然后单个属性-属性值对写入,具体实现细节就不写了,就是利用pack函数打包。