這篇小短文講的是啥
之前看到有人問(wèn)到 PHPHub 遷移數(shù)據(jù)庫(kù)文件中 nullable 和索引的問(wèn)題,相信很多用了 MySQL 很久的人(特別是平時(shí)過(guò)多關(guān)注業(yè)務(wù)開(kāi)發(fā)的人),對(duì)這兩個(gè)字段屬性的概念還不是很清楚,一般會(huì)有以下疑問(wèn):
我字段類型是 not null,為什么我可以插入 空值;
為毛 not null 的效率比 null 高;
判斷字段不為空的時(shí)候,到底要 column <> '' 還是要用 column is not null 呢。
帶著上面幾個(gè)疑問(wèn),我們來(lái)深入研究一下 null 和 not null 到底有什么不一樣。
null 和 空值 一樣么
首先,我們要搞清楚 空值 和 null 的概念:
空值 是不占用空間的;
MySQL 中的 null 其實(shí)是占用空間的,下面是來(lái)自于 MYSQL 官方的解釋:
NULL columns require additional space in the row to record whether their values are NULL. For MyISAM tables, each NULL column takes one bit extra, rounded up to the nearest byte.
打個(gè)比方來(lái)說(shuō),你有一個(gè)杯子,空值代表杯子是真空的,NULL 代表杯子中裝滿了空氣,雖然杯子看起來(lái)都是空的,但是區(qū)別是很大的。
一個(gè)小栗子
搞清楚 “空值” 和 “NULL” 的概念之后,問(wèn)題基本就明了了,我們搞個(gè)例子測(cè)試一下:
CREATE TABLE `test` ( `col1` VARCHAR( 10 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL , `col2` VARCHAR( 10 ) CHARACTER SET utf8 COLLATE utf8_general_ci NULL ) ENGINE = MYISAM ;
問(wèn)題 1:我字段類型是 not null,為什么我可以插入 空值?
執(zhí)行下面的 SQL,發(fā)生錯(cuò)誤,提示 Column 'col1' cannot be null。
INSERT INTO `test` VALUES ( null, 1);
再來(lái)一條,執(zhí)行成功。
INSERT INTO `test` VALUES ('',1);
可見(jiàn),NOT NULL 的字段是不能插入 NULL 的(這不是廢話么 ),只能插入 空值,上面的問(wèn)題 1 也就有答案了。
問(wèn)題 2:為毛 not null 的效率比 null 高?
對(duì)于問(wèn)題 2,上面我們已經(jīng)說(shuō)過(guò)了,NULL 其實(shí)并不是空值,而是要占用空間,所以 mysql 在進(jìn)行比較的時(shí)候,NULL 會(huì)參與字段比較,所以對(duì)效率有一部分影響。
而且 B 樹(shù)索引時(shí)不會(huì)存儲(chǔ) NULL 值的,所以如果索引的字段可以為 NULL,索引的效率會(huì)下降很多。
問(wèn)題 3:判斷字段不為空的時(shí)候,到底要 column<>'' 還是要用 column is not null 呢。
我們?cè)傧?test 的表中插入幾條數(shù)據(jù):
INSERT INTO `test` VALUES ('', NULL); INSERT INTO `test` VALUES ('1', '2');
現(xiàn)在根據(jù)需求,我要統(tǒng)計(jì) test 表中 col1 不為空的所有數(shù)據(jù),我是該用 <>'' 還是 IS NOT NULL 呢,讓我們來(lái)看一下結(jié)果的區(qū)別。
現(xiàn)在表中的數(shù)據(jù)如下:
分別對(duì)照以下兩句 SQL 的執(zhí)行效果
SELECT * FROM `test` WHERE col1 IS NOT NULL
SELECT * FROM `test` WHERE col1 <> ''
可以看到,結(jié)果迥然不同,所以我們一定要根據(jù)業(yè)務(wù)需求,搞清楚到底是要用那種搜索條件,以及要不要為 null。
自己遇到的一個(gè)小坑
在許久以前剛?cè)肼氉龅谝粋€(gè)需求上線的時(shí)候,只一味注意到說(shuō)是 not null 的效率比 null 的效率高。
好嘛~自己在現(xiàn)有的表上增加字段時(shí)全設(shè)置為了 not null,感覺(jué)自己屌屌的。
因?yàn)樵S多 Service 都有操作這個(gè)表的插入動(dòng)作,結(jié)果可想而知,剛上線,錯(cuò)誤 Column 'col1' cannot be null 彌漫了整個(gè)開(kāi)發(fā)組每個(gè)人的郵箱。
所以,當(dāng)業(yè)務(wù)量不是很大的情況下,很多技術(shù)的使用其實(shí)都需要根據(jù)實(shí)際狀況綜合考慮。