例如,某个房间可从[灯,床,桌,椅,杯子,饮水机……]这些器具中挑选,从而组成这个房间的装潢。我们可能会设计一个房间表,再设计一个器具表,再设计一个关系表,通过这个关系表来保存它们之间的映射关系。但是这样的效率明显是比较差的,需要同时查询三张表才能完成。
我们提供一种通过一个值来计算即可获得这一器具组合的结果,方法如下:
array( '1' => '灯' '2' => '床', '4' => '桌', '8' => '椅子', '16' => '饮水机', …… )
如果我们将5保存到数据库中,我们可以立马知道,这个房间有“灯”和“桌”,而如果保存的是23,则一定有“灯”“床”“桌”和“饮水机”。
给每一个器具一个给定的值,这个值一定是2的n次方(n>=0),这样就可以保证相加之后的值可以反解。这个情况的核心原理在于,给定任何数值的前面数值相加和,一定小于当前数值。如何进行反解呢?
例如我们拿到一个值为N,那么我们可以首先找到最大的2n,确定2n是一定有的,如果没有2n,就不可能相加得到N。
接下来我们获得M = N - 2n,找到最大的2m,再进行M - 2m,如此推论下去,直到减完为止。
那么怎获得最大的2n呢?
$n = (int)log(N,2);
log函数在PHP4+之后内置,用于取对数,返回值为float类型,但我们仅需要整数部分,因此前面加(int)。
例如N=22,那么$n=4,再去计算2^4,就是16。
通过这个方法,我们可以非常顺利的在一个数据表中用一个值保存多种情况。但是,这也有一定的适用范围,比如这些情况最好是固定不变的,2n值不能太大等等。通过这种方法可以用该值进行权重设计,进行排序,但是不能用于条件检索,比如你想检索数据库中包含“床”的房间,你就不好进行检索,因为大部分房间的该值可能都大于2. 所以,在使用这种方法时,应该根据实际需要进行考虑。
更新:
在数据库中,我们可以使用一种序列化的类二进制字符串来保存多个值,当这个二进制值是以01组成时,实际上就可以换算成为一个十进制数,从而也就实现了一个十进制值保存多种情况的目的。
下面我们来做一个演示。
例如我们在订票系统中,规定某一个活动每天分为6个场次,每个场次2个小时,因此实际上就把一天的12个小时分为了6份,分别是9:00-11:00,11:00-13:00,13:00-15:00,15:00-17:00,17:00-19:00:19:00-21:00
,我们用“xxxxxx”(x取0或1)来表示,现在,我们要记录这些场次是否全部被定完了,用1表示全部被订完,所以“010110”就表示11:00-13:00,15:00-17:00,17:00-19:00这三个场次已经被订完了,不能再对外售票。
我们在数据库中怎么保存呢?
php提供了将二进制转换为十进制的函数bindec(),我们先将二进制值转换为十进制值后,再保存到数据库中。而当我们要使用时,从数据库中取出十进制值,再使用decbin()将值转换为二进制值,当然,我们要补全最后得到的二进制值的位数,也就是前面加0,然后再进行字符串数组处理,进行对比。
在编程世界中,还有一个比较好玩的算法,叫“按位异或”。按位,就是以二进制的形式进行计算,“按位异或”就是两个位的值不同时返回1,否则返回0。通过这个运算,我们可以得到看上去非常复杂的结果。在php中,运算为“^”。下面我们来进行一下演算。
001011 ^ 011010 = 010001 (1式,注意,开头的0会被忽略,因此不要把开头的0也算进来)
提按位异或有什么意义呢?因为二进制值可以和十进制值进行转换,因此我们将二进制值转换为十进制值进行按位异或之后,得到的值也是十进制的,我们只有将这些十进制数转换为二进制字串后,才能发现规律,但是如果我们直接用十进制进行计算,却能快速得到结果。
下面我们就来演算一次,我们拿(1式)来看。如果将二进制数转换为十进制,我们就能得到
11 ^ 26 = 17
那事实的结果是不是这样呢?你可以在你的php程序中写上:
<?php
echo 11 ^ 26;
是的,结果就是这样。可是,这个复杂的运算有什么用呢?它可以用于比较。比如我们的数据库中存放了11,转换为二进制就是“001011”,也就是表示这一天的场次中,对应的那三个时段已经满票了。但是如果我们现在正好要进行对比,看看这一天中17:00-19:00这个时段是否满票,我们怎么能准确知道11这个值转换为001011后,第5个位上的值是否为1呢?
我们只需要用这种思路来解决即可:
xxxxxx ^ 000010 = ?
其中xxxxxx是我们要对比的值,比如当它等于11时,也就是001011时,等式的右边会得到001001(9)。我们再来看另一个算式:
xxxxxx ^ 000000 = ?
等式右边会得到本身。
如果我们再用001001(9)去按位异或000010,则会得到001011(11)。
我们得到的结论就是,凡是用xxxxx去按位异或yyyyyy(其中只有一个y为1,其他全为0),得到的结果比自身小的,则对应位置上的值为1;得到的结果比自身大的,对应的位置上为0。通过这种方法,也就找到了哪个时间段是被订满票的。
为什么大于自身的,对应的位置上就一定为0呢?因为0^1=1,而二进制数是01构成的,也就是说0和1碰上0时,都不会变化,而只有0碰上1时才会变化。说白了,用任何一个二进制数去按位异或000100,结果发生的情况就两种,一种是第四个位置上的值由1变为0(结果值相对于本身值而言),这种情况下该值变小,一种是第四个位置上的值由0变为1,这种情况下该值变大。
了解了这个原理之后,我们只需要在数据库中保存二进制转换而来的十进制值,在查询时,用对比值(二进制转换而来的十进制值)去按位异或一下,即可得到我们想要的结果。例如:
SELECT COUNT(id) FROM table WHERE id=8 AND day='2015-08-20' AND (hours ^ 2)<hours;
这样就可以判断出8月20号这天17:00-19:00这个时间段是否被订满(如果返回1,则表示被订满了)。
如果我们不满意用大小比较来进行判断,我们还可以深入发现,按位异或结果与原值之间的差值,正好是用来异或的值,也就是满足下面的等式:
|m ^ n - m| = n (n为yyyyyy,只有一个y为1,其他为0)
|x|是指绝对值,当不取绝对值,得到的为负数时,说明结果变小了,那么原值对应的位置上也就是1,而如果得到的为正数,说明结果变大,对应的位置上就为0。所以,上述sql,我们还可以这样去改:
SELECT id FROM table WHERE id=8 AND day='2015-08-20' AND (hours ^ 2 + 2)=hours;
如果查到了结果,说明id为8的这条记录8月20号这天17:00-19:00这个时间段被订满。
这种魔术般的使用方法,你是否思考过呢?
再议
实际上,一个二进制数,我们将它转换为十进制时,将它的各个位置值(从右往左,以0为开始)作为次数求2的次幂,再乘以该位置上的数,再相加,即得到该二进制数对应的十进制数,例如:
10100 = 0(2^0) + 0(2^1) + 1(2^3) + 0(2^4) + 1*(2^5) = 8 + 32 = 40
这样去观察,就发现实际上8和32,就是我们第一次接触这种算法时,将它们作为一个数组的索引值,进行物品的索引进行计算。
2015-07-06 3334