设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小。
目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)。
第一范式(1NF):属性不可分。
第一范式是指数据库的每一列都是不可分割的基本数据项,强调列的原子性,即实体中的某个属性有多个值时,必须拆分为不同的属性。比如数据表的电话号码列,这个列就不明确,既可以填手机号码也可以填座机号码,或者两者都填。这不符合第一范式,这个列就是可以再分的,可以分成“手机号码”和“座机号码”两列。第一范式(1NF)是对关系模式的设计基本要求,一般设计中都必须满足第一范式(1NF)。
第二范式(2NF):符合1NF,并且非主属性完全依赖于主键。
第二范式建立在第一范式的基础上,即满足第二范式一定满足第一范式,第二范式要求数据表每一个实例或者行必须被唯一标识。除满足第一范式外还有两个条件,一是表必须有一个主键;二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分。
第三范式(3NF):符合2NF,并且消除传递依赖。
若某一范式是第二范式,且每一个非主属性都不传递依赖于该范式的候选键,则称为第三范式,即不能存在:非主键列 A 依赖于非主键列 B,非主键列 B 依赖于主键的情况。
举例来说:员工表Employee(emp_id,emp_name,emp_age,dept_id,dept_name,dept_info),当员工表中emp_id能够唯一确定员工员工信息,但是dept_name可由dept_id唯一确定,此时,该表不符合第三范式,此时可以删除除了dept_id之外的其他部门信息,把所有部门信息单独建立一张部门表。这样如果员工调动部门,只需修改dept_id列即可,否则需要修改很多部门相关的信息,而且有可能造成数据不一致。
一般开发中数据库设计到第三范式也就可以了,其它范式如果有兴趣可以参考专业书籍和资料。其实在开发中为了提高开发效率会冗余一些字段,未必非要完全遵守第三范式,但它仍然对我们设计数据库具有重要指导意义。