数据库中用一个值来保存多种情况：二进制和按位异或|唐霜

这篇文章是我刚工作一年的时候写的，现在回读起来，也挺佩服当初自己的思考精神，不一定要用到生产环境，但是是一个非常不错是思考过程。

例如，某个房间可从[灯,床,桌,椅,杯子,饮水机……]这些器具中挑选，从而组成这个房间的装潢。我们可能会设计一个房间表，再设计一个器具表，再设计一个关系表，通过这个关系表来保存它们之间的对应关系。但是这样的效率明显是比较差的，需要同时查询三张表才能完成。

为了不适用关系表，我们还可以在房间表中设计一个字段，通过一个有规律的字符串来保存器具表的器具ID，例如：

1,2,3,7

下面，我们提供一种通过一个值来计算即可获得这一器具组合的结果，方法如下：

array(
  '1' => '灯'
  '2' => '床',
  '4' => '桌',
  '8' => '椅子',
  '16' => '饮水机',
  ……
);

如果我们将5保存到数据库中，我们可以立马知道，这个房间有“灯”和“桌”，而如果保存的是23，则一定有“灯”“床”“桌”和“饮水机”。

给每一个器具一个给定的值，这个值一定是2的n次方（n>=0），这样就可以保证相加之后的值可以反解。这个情况的核心原理在于，给定任何数值的前面数值相加和，一定小于当前数值。如何进行反解呢？

例如我们拿到一个值为N，那么我们可以首先找到最大的2^n，确定2^n是一定有的，如果没有2^n，就不可能相加得到N。

接下来我们获得M = N - 2^n，找到最大的2^m，再进行M - 2^m，如此推论下去，直到减完为止。

那么怎获得最大的2^n呢？

$n = (int)log(N,2);

log函数在PHP4+之后内置，用于取对数，返回值为float类型，但我们仅需要整数部分，因此前面加(int)。

例如N=22，那么$n=4，再去计算2^4，就是16。

通过这个方法，我们可以非常顺利的在一个数据表中用一个值保存多种情况。但是，这也有一定的适用范围，比如这些情况最好是固定不变的，2n值不能太大等等。通过这种方法可以用该值进行权重设计，进行排序，但是不能用于条件检索，比如你想检索数据库中包含“床”的房间，你就不好进行检索，因为大部分房间的该值可能都大于2.所以，在使用这种方法时，应该根据实际需要进行考虑。

更新：

在数据库中，我们可以使用一种序列化的类二进制字符串来保存多个值，当这个二进制值是以01组成时，实际上就可以换算成为一个十进制数，从而也就实现了一个十进制值保存多种情况的目的。

下面我们来做一个演示。

例如我们在订票系统中，规定某一个活动每天分为6个场次，每个场次2个小时，因此实际上就把一天的12个小时分为了6份，分别是9:00-11:00,11:00-13:00,13:00-15:00,15:00-17:00,17:00-19:00:19:00-21:00，我们用“xxxxxx”(x取0或1)来表示，现在，我们要记录这些场次是否全部被定完了，用1表示全部被订完，所以“010110”就表示11:00-13:00,15:00-17:00,17:00-19:00这三个场次已经被订完了，不能再对外售票。

我们在数据库中怎么保存呢？

php提供了将二进制转换为十进制的函数bindec()，我们先将二进制值转换为十进制值后，再保存到数据库中。而当我们要使用时，从数据库中取出十进制值，再使用decbin()将值转换为二进制值，当然，我们要补全最后得到的二进制值的位数，也就是前面加0，然后再进行字符串数组处理，进行对比。

在编程世界中，还有一个比较好玩的算法，叫“按位异或”。按位，就是以二进制的形式进行计算，“按位异或”就是两个位的值不同时返回1，否则返回0。通过这个运算，我们可以得到看上去非常复杂的结果。在php中，运算为“^”。下面我们来进行一下演算。

001011 ^ 011010 = 010001 （1式，注意，开头的0会被忽略，因此不要把开头的0也算进来）

提按位异或有什么意义呢？因为二进制值可以和十进制值进行转换，因此我们将二进制值转换为十进制值进行按位异或之后，得到的值也是十进制的，我们只有将这些十进制数转换为二进制字串后，才能发现规律，但是如果我们直接用十进制进行计算，却能快速得到结果。

下面我们就来演算一次，我们拿（1式）来看。如果将二进制数转换为十进制，我们就能得到

11 ^ 26 = 17

那事实的结果是不是这样呢？你可以在你的php程序中写上：

<?php
echo 11 ^ 26;

是的，结果就是这样。可是，这个复杂的运算有什么用呢？它可以用于比较。比如我们的数据库中存放了11，转换为二进制就是“001011”，也就是表示这一天的场次中，对应的那三个时段已经满票了。但是如果我们现在正好要进行对比，看看这一天中17:00-19:00这个时段是否满票，我们怎么能准确知道11这个值转换为001011后，第5个位上的值是否为1呢？

我们只需要用这种思路来解决即可：

xxxxxx ^ 000010 = ?

其中xxxxxx是我们要对比的值，比如当它等于11时，也就是001011时，等式的右边会得到001001（9）。我们再来看另一个算式：

xxxxxx ^ 000000 = ?

等式右边会得到本身。

如果我们再用001001（9）去按位异或000010，则会得到001011（11）。

我们得到的结论就是，凡是用xxxxx去按位异或yyyyyy（其中只有一个y为1，其他全为0），得到的结果比自身小的，则对应位置上的值为1，得到的结果比自身大的，对应的位置上为0。通过这种方法，也就找到了哪个时间段是被订满票的。

为什么大于自身的，对应的位置上就一定为0呢？因为0^1=1，而二进制数是01构成的，也就是说0和1碰上0时，都不会变化，而只有0碰上1时才会变化。说白了，用任何一个二进制数去按位异或000100，结果发生的情况就两种，一种是第四个位置上的值由1变为0（结果值相对于本身值而言），这种情况下该值变小，一种是第四个位置上的值由0变为1，这种情况下该值变大。了解了这个原理之后，我们只需要在数据库中保存二进制转换而来的十进制值，在查询时，用对比值（二进制转换而来的十进制值）去按位异或一下，即可得到我们想要的结果。

我们创建如下表结构，sale_over在实际存储时，我们转换为十进制整数进行存储，这里方便演示用二进制表示。每次在用户下订单时对票数进行检查，如果该时段已经有20张票被订出，就在下表中更新一条记录，把对应的时段改为1.

tablename = objectorder

id	object_id	day	sale_over
1	5	2015-08-23	011000
2	8	2015-08-24	100101
3	5	2015-08-25	010001

例如：

SELECT COUNT(id) FROM object_order WHERE object_id=8 AND day='2015-08-20' AND (hours ^ 2)<hours;

这样就可以判断出8月20号这天17:00-19:00这个时间段是否被订满（如果返回1，则表示被订满了）。

如果我们不满意用大小比较来进行判断，我们还可以深入发现，按位异或结果与原值之间的差值，正好是用来异或的值，也就是满足下面的等式：

|m ^ n - m| = n (n为yyyyyy,只有一个y为1，其他为0)

|x|是指绝对值，当不取觉得值，得到的为负数时，说明结果变小了，那么原值对应的位置上也就是1，而如果得到的为正数，说明结果变大，对应的位置上就为0。所以，上述sql，我们还可以这样去改：

SELECT COUNT(id) FROM object_order WHERE object_id=8 AND day='2015-08-20' AND (hours ^ 2 + 2)=hours;

如果查到了结果，说明8这个活动8月20号这天17:00-19:00这个时间段被订满。

这种魔术般的使用方法，你是否思考过呢？

再议

实际上，一个二进制数，我们将它转换为十进制时，将它的各个位置值（从右往左，以0为开始）作为次数求2的次幂，再乘以该位置上的数，再相加，即得到该二进制数对应的十进制数，例如：

10100 = 0(2^0) + 0(2^1) + 1(2^3) + 0(2^4) + 1*(2^5) = 8 + 32 = 40

这样去观察，就发现实际上8和32，就是我们第一次接触这种算法时，将它们作为一个数组的索引值，进行物品的索引进行计算。

接下来，我们要更换场景，每个时段仅可以被一个人预订，用户每一次下订单完成之后，形成一条记录，这些记录以上述形式存储，得到如下订单数据表：

tablename = userorder

id	user_id	object_id	day	hours
1	2	5	2015-08-23	011000
2	3	8	2015-08-24	100000
3	2	5	2015-08-24	000001

类似这样的订单记录，hours字段中每个位置上的1最多出现1次，怎么样确定某一天的所有票都已经定出去了呢？

其实这是最简单的，就是对该字段进行求和，例如：

SELECT SUM(hours) FROM user_order WHERE object_id=8 AND day='2015-08-20';

如果最终得到的值为111111，也就是十进制的63，则说明该天各个时段已订满，不能再进行预订。

最后一种情况则是对上面两张场景的结合，也就是每个时段最多可以被预订20张票，数据库中记录的是单个用户的订单。

当然，遇到这种情况，其实我们可以准备两张表，一张是用户的订单表：

tablename = userorder

id	user_id	object_id	day	hours
1	2	5	2015-08-23	011000
2	3	8	2015-08-24	100000
3	2	5	2015-08-24	000001

(第一条记录表示用户2在2015-08-23这天预订了5这个活动的11点13点这两个时段的票)

一张用来在每次用户订单完成时，对该时段进行判断，如果这个时段已经卖出20张，就改为1，进行更新操作的场次预订情况表：

tablename = objectorder

id	object_id	day	sale_over
1	5	2015-08-23	011000
2	8	2015-08-24	100101
3	5	2015-08-25	010001

但是这样的话，我们通过该表，仅能判断是否卖完，而不知道已经卖了多少张。为了解决这个问题，我们夸张的做法是，直接在这个表的基础上进行扩展，增加20个字段，每个字段对应一个时段，用来记录所卖出的票数，但是这样实在太蠢了。由于二进制方式，无法在每个位置上表示实际的值，例如在第2个位置上用3来表示卖出3张，这是我们无法做到的，所以，我们可以通过前面一张用户下的订单列表来进行计算，从而找出某个位置上是否已经存在20个1.

实际上，我们现在要解决的，就是查出每个时段已经订出了多少张票。

我们可以用

SELECT COUNT(id) FROM user_order WHERE object_id=8 AND day='2015-08-20' AND (hours ^ 2 + 2)=hours;

这种方法就可以查出来某个时段的被订数量，如果返回值等于20，则说明该时段已经被定完了。但是，我们如何从所有的记录中，找出那些天的席位被全部定光呢？因为我们不打算使用objectorder表来记录，而是想直接通过userorder进行查询，所以我们不仅要判断某个位置上的为1的记录数是否为20，而且要判断所有的位置。

最笨的方法就是连续判断6次，对每个位置都进行统计，最终进行判断。但是这明显不符合我们的要求。

实际上，我们仍然使用求和即可完成，我们在前面进行求和时，只需要用111111进行对比，也就是十进制的63进行对比，而这次，我们用20个111111进行对比，也就是63*20 = 1260进行对比即可。

SELECT SUM(hours) FROM user_order WHERE object_id=8 AND day='2015-08-20';

如果得到的返回值等于1260，说明这一天的所有场次已经完全订出去了。

用这种方法处理数据库中保存有规律的多种情况保存，就变得轻松有趣了。

2018-12-18 3709

唐霜

数据库中用一个值来保存多种情况：二进制和按位异或

为价值买单，打赏一杯咖啡

声明

关于

生态