2009-02-11
今天,在查看测试提交的一个bug问题的时候,发现了一个有关于数据之间相除,和sum函数的关于某类型数据的自动截取问题(也许是我的想当然,呵呵),在这里做一个记录,和大家一起讨论一下。希望哪位牛人可以给予指教!
现在自己创建一张数据表,用来测试这个问题:
第一步,创建一个表T,创建4个数据类型不同的列,并赋值。
CREATE TABLE T ( a INT ,b numeric (20,8),c numeric (20, 2),D numeric (20, 2) ) ; go -- INSERT INTO T (a,b,c,d) VALUES (10,4.33,2.7,5.1) ; INSERT INTO T (a,b,c,d) VALUES (47,9,111,7) ; go -- select * from T select sum(a) as a,Sum(b) as b,sum(a)/Sum(b) as ab,sum(c) as c,sum(d) as d,sum(c)/sum(d) as cd from T group by a,b,c,d select *,a/b as ab,c/d as cd from T -- drop table T
查询结果如下图:
可以发现,此时同样的查询语句和相应的运算规则,在加上sum函数之后,得到的结果是不一样的。a是int,b是numeric,两者sum后相除得到的数据精确度为查询分析器的最大精确度;c和d都是numeric型,这两者sum后相除得到的数据精确度则为小数点后6位。
如果对结果加上round函数进行截取的话,得到以下结果:
select sum(a) as a,Sum(b) as b,round(sum(a)/Sum(b),10) as ab,sum(c) as c,sum(d) as d,round(sum(c)/sum(d),4) as cd from T group by a,b,c,d select sum(a) as a,Sum(b) as b,round(sum(a)/Sum(b),10) as ab,sum(c) as c,sum(d) as d,round(sum(c)/sum(d),10) as cd from T group by a,b,c,d
可以发现,round函数对于结果截取6位的问题没有影响。
第二步,接着进行其它类型数据的实验
-- 测试decimal类型 ALTER TABLE T ALTER COLUMN c decimal (20, 10) ; ALTER TABLE T ALTER COLUMN d decimal (20, 10) ; -- 查询表结构,引用邹建的代码 SELECT TableName=CASE WHEN C.column_id=1 THEN O.name ELSE N'' END, TableDesc=ISNULL(CASE WHEN C.column_id=1 THEN PTB.[value] END,N''), Column_id=C.column_id, ColumnName=C.name, PrimaryKey=ISNULL(IDX.PrimaryKey,N''), [IDENTITY]=CASE WHEN C.is_identity=1 THEN N'√'ELSE N'' END, Computed=CASE WHEN C.is_computed=1 THEN N'√'ELSE N'' END, Type=T.name, Length=C.max_length, Precision=C.precision, Scale=C.scale, NullAble=CASE WHEN C.is_nullable=1 THEN N'√'ELSE N'' END, [Default]=ISNULL(D.definition,N''), ColumnDesc=ISNULL(PFD.[value],N''), IndexName=ISNULL(IDX.IndexName,N''), IndexSort=ISNULL(IDX.Sort,N''), Create_Date=O.Create_Date, Modify_Date=O.Modify_date FROM sys.columns C INNER JOIN sys.objects O ON C.[object_id]=O.[object_id] AND O.type='U' AND O.is_ms_shipped=0 INNER JOIN sys.types T ON C.user_type_id=T.user_type_id LEFT JOIN sys.default_constraints D ON C.[object_id]=D.parent_object_id AND C.column_id=D.parent_column_id AND C.default_object_id=D.[object_id] LEFT JOIN sys.extended_properties PFD ON PFD.class=1 AND C.[object_id]=PFD.major_id AND C.column_id=PFD.minor_id -- AND PFD.name='Caption' -- 字段说明对应的描述名称(一个字段可以添加多个不同name的描述) LEFT JOIN sys.extended_properties PTB ON PTB.class=1 AND PTB.minor_id=0 AND C.[object_id]=PTB.major_id -- AND PFD.name='Caption' -- 表说明对应的描述名称(一个表可以添加多个不同name的描述) LEFT JOIN -- 索引及主键信息 ( SELECT IDXC.[object_id], IDXC.column_id, Sort=CASE INDEXKEY_PROPERTY(IDXC.[object_id],IDXC.index_id,IDXC.index_column_id,'IsDescending') WHEN 1 THEN 'DESC' WHEN 0 THEN 'ASC' ELSE '' END, PrimaryKey=CASE WHEN IDX.is_primary_key=1 THEN N'√'ELSE N'' END, IndexName=IDX.Name FROM sys.indexes IDX INNER JOIN sys.index_columns IDXC ON IDX.[object_id]=IDXC.[object_id] AND IDX.index_id=IDXC.index_id LEFT JOIN sys.key_constraints KC ON IDX.[object_id]=KC.[parent_object_id] AND IDX.index_id=KC.unique_index_id INNER JOIN -- 对于一个列包含多个索引的情况,只显示第1个索引信息 ( SELECT [object_id], Column_id, index_id=MIN(index_id) FROM sys.index_columns GROUP BY [object_id], Column_id ) IDXCUQ ON IDXC.[object_id]=IDXCUQ.[object_id] AND IDXC.Column_id=IDXCUQ.Column_id AND IDXC.index_id=IDXCUQ.index_id ) IDX ON C.[object_id]=IDX.[object_id] AND C.column_id=IDX.column_id WHERE O.name=N'T' -- 如果只查询指定表,加上此条件 ORDER BY O.name,C.column_id -- select sum(a) as a,Sum(b) as b,sum(a)/Sum(b) as ab,sum(c) as c,sum(d) as d,sum(c)/sum(d) as cd from T group by a,b,c,d
由结果可见,修改为decmial之后,数据仍然是截取6位。
第三步,测试float的类型。
-- 测试float类型 ALTER TABLE T ALTER COLUMN c float ; ALTER TABLE T ALTER COLUMN d float ; -- 查询表结构,引用邹建的代码 SELECT TableName=CASE WHEN C.column_id=1 THEN O.name ELSE N'' END, TableDesc=ISNULL(CASE WHEN C.column_id=1 THEN PTB.[value] END,N''), Column_id=C.column_id, ColumnName=C.name, PrimaryKey=ISNULL(IDX.PrimaryKey,N''), [IDENTITY]=CASE WHEN C.is_identity=1 THEN N'√'ELSE N'' END, Computed=CASE WHEN C.is_computed=1 THEN N'√'ELSE N'' END, Type=T.name, Length=C.max_length, Precision=C.precision, Scale=C.scale, NullAble=CASE WHEN C.is_nullable=1 THEN N'√'ELSE N'' END, [Default]=ISNULL(D.definition,N''), ColumnDesc=ISNULL(PFD.[value],N''), IndexName=ISNULL(IDX.IndexName,N''), IndexSort=ISNULL(IDX.Sort,N''), Create_Date=O.Create_Date, Modify_Date=O.Modify_date FROM sys.columns C INNER JOIN sys.objects O ON C.[object_id]=O.[object_id] AND O.type='U' AND O.is_ms_shipped=0 INNER JOIN sys.types T ON C.user_type_id=T.user_type_id LEFT JOIN sys.default_constraints D ON C.[object_id]=D.parent_object_id AND C.column_id=D.parent_column_id AND C.default_object_id=D.[object_id] LEFT JOIN sys.extended_properties PFD ON PFD.class=1 AND C.[object_id]=PFD.major_id AND C.column_id=PFD.minor_id -- AND PFD.name='Caption' -- 字段说明对应的描述名称(一个字段可以添加多个不同name的描述) LEFT JOIN sys.extended_properties PTB ON PTB.class=1 AND PTB.minor_id=0 AND C.[object_id]=PTB.major_id -- AND PFD.name='Caption' -- 表说明对应的描述名称(一个表可以添加多个不同name的描述) LEFT JOIN -- 索引及主键信息 ( SELECT IDXC.[object_id], IDXC.column_id, Sort=CASE INDEXKEY_PROPERTY(IDXC.[object_id],IDXC.index_id,IDXC.index_column_id,'IsDescending') WHEN 1 THEN 'DESC' WHEN 0 THEN 'ASC' ELSE '' END, PrimaryKey=CASE WHEN IDX.is_primary_key=1 THEN N'√'ELSE N'' END, IndexName=IDX.Name FROM sys.indexes IDX INNER JOIN sys.index_columns IDXC ON IDX.[object_id]=IDXC.[object_id] AND IDX.index_id=IDXC.index_id LEFT JOIN sys.key_constraints KC ON IDX.[object_id]=KC.[parent_object_id] AND IDX.index_id=KC.unique_index_id INNER JOIN -- 对于一个列包含多个索引的情况,只显示第1个索引信息 ( SELECT [object_id], Column_id, index_id=MIN(index_id) FROM sys.index_columns GROUP BY [object_id], Column_id ) IDXCUQ ON IDXC.[object_id]=IDXCUQ.[object_id] AND IDXC.Column_id=IDXCUQ.Column_id AND IDXC.index_id=IDXCUQ.index_id ) IDX ON C.[object_id]=IDX.[object_id] AND C.column_id=IDX.column_id WHERE O.name=N'T' -- 如果只查询指定表,加上此条件 ORDER BY O.name,C.column_id -- select sum(a) as a,Sum(b) as b,sum(a)/Sum(b) as ab,sum(c) as c,sum(d) as d,sum(c)/sum(d) as cd from T group by a,b,c,d
结果集
可以发现,修改为float类型之后,数据就不再发生截取为精确度为小数点后6位的情况了。
不解中。
查了下SQL server的帮助,关于sum函数的说明如下:
SUM ( [ ALL | DISTINCT ] expression ) |
ALL
对所有的值应用此聚合函数。ALL 是默认值。
DISTINCT
指定 SUM 返回唯一值的和。
expression
常量、列或函数与算术、位和字符串运算符的任意组合。expression 是精确数字或近似数字数据类型类别(bit 数据类型除外)的表达式。不允许使用聚合函数和子查询。有关详细信息,请参阅表达式(Transact-SQL)。
以最精确的 expression 数据类型返回所有 expression 值的和。
表达式结果 | 返回类型 |
---|---|
整数类别 |
int |
decimal 类别 (p, s) |
decimal(38, s) |
money 和 smallmoney 类别 |
money |
float 和 real 类别 |
float |
重要事项: |
---|
当使用 CUBE 或 ROLLUP 时,不支持非重复聚合,例如 AVG(DISTINCT column_name)、COUNT(DISTINCT column_name)、MAX(DISTINCT column_name)、MIN(DISTINCT column_name) 和 SUM(DISTINCT column_name)。如果使用这类聚合,SQL Server 2005 Database Engine 将返回错误消息并取消查询。
|
针对这个情况分析,当数据类型都为DECIMAL(20,10)的时候,按照帮助文档的规则的话,经过sum函数处理之后的值应该也是DECIMAL(20,10)。
可实际情况是,当数据类型都为numeric或者DECIMAL类型时,数据在sum函数处理后再相除的话,会发生数据自动截取为小数点后6位的情况。而当数据类型都为float,或一个为int、一个为DECIMAL等数据类型时(还有其他场景,就不一一举例了),此时不会发生小数位的自动截取为6位的情况。
个人初步觉得是SQL server的数据处理的一个小bug所致,希望有高手能够给予帮助和分析。