type
status
date
slug
summary
tags
category
icon
password
Property
K&C给出了7个与类型相关的关键字。C90标准添加了2个关键字,C99标准又添加了3个关键字
位、字节和字
- 位(bit) 来自英文 bit,音译为“比特”,表示二进制位。位是计算机内部数据储存的最小单位,11010100是一个 8 位二进制数。一个二进制位只可以表示 0 和 1 两种状态;两个二进制位可以表示 00、01、10、11 四种状态;三位二进制数可表示八种状态……。
- 字节(Byte)来自英文 Byte,音译为“拜特”,习惯上用大写的“B”表示。字节是计算机中数据处理的基本单位。计算机中以字节为单位存储和解释信息,规定一个字节由八个二进制位构成,即 1 个字节等于 8 个比特(1Byte=8bit)。八位二进制数最小为 00000000,最大为 11111111;通常 1 个字节可以存入一个 ASCII 码,2 个字节可以存放一个汉字国标码。
- 字(word) 计算机进行数据处理时,一次存取、加工和传送的数据长度称为字。一个字通常由一个或多个(一般是字节的整数位)字节构成。例如 286 微机的字由 2 个字节组成,它的字长为 16;486 微机的字由 4 个字节组成,它的字长为 32 位。计算机的字长决定了其 CPU 一次操作处理实际位数的多少,由此可见计算机的字长越大,其性能越优越。
整数
整数是没有小数部分的数。计算机以二进制数字储存整数,例如,整数7以二进制写是111。因此,要在8位字节中储存该数字,需要把前5位都设置成0,后3位设置成1:
int类型
C语言提供了许多整数类型,一般情况使用
int
类型即可。int
类型是有符号整型,值必须是整数,可以是正整数、负整数或零。其取值范围依计算机系统而异,一般储存一个int
要占用一个机器字长。早期的16位IBM PC兼容机使用16位来储存一个int值,其取值范围是-32768~32767。目前的个人计算机一般是32/64位,因此用32/64位储存一个int
值。ISO C规定int
的取值范围最小为-32768~32767
。C语言把大多数整型常量视为int类型,但是非常大的整数除外。声明
int
变量:以上声明创建了变量,但是并没有给它们提供值。变量如何获得值?
- 第1种途径是赋值:
- 第2种途径是通过函数(如
scanf()
)获得值。
- 第3种途径是初始化变量,为变量赋一个初始值,C语言初始化可以直接在声明中完成:
打印int值
可以使用
printf()
函数打印int
类型的值,%d
指明了在一行中打印整数的位置。%d
称为转换说明,指定了printf()
应使用什么格式来显示一个值。格式化字符串中的每个%d
都与待打印变量列表中相应的int
值(int
变量、int
常量或其他任何值为int
的表达式)匹配。大部分函数都需要指定数目的参数,编译器会检查参数的数目是否正确。但是,
printf()
函数的参数数目不定,可以有1个、2个或更多,编译器也爱莫能助。使用printf()
函数时,要确保转换说明的数量与待打印值的数量相等。进制
通常,C语言都假定整型常量是十进制数。然而,许多程序员很喜欢使用八进制和十六进制数。因为8和16都是2的幂,在表达与计算机相关的值时很方便。
计算机如何知道10000是十进制、十六进制还是二进制?
在C语言中,用特定的前缀表示使用哪种进制。0x或0X前缀表示十六进制值,所以十进制数16表示成十六进制是0x10或0X10。与此类似,0前缀表示八进制。例如,十进制数16表示成八进制是020。
使用不同的进制数是为了方便,不会影响数被储存的方式。无论把数字写成16、020或0x10,计算机内部都以二进制进行编码。
以十进制显示数字,使用
%d
;以八进制显示数字,使用%o
;以十六进制显示数字,使用%x
。要显示各进制数的前缀0、0x和0X,必须分别使用%#o
、%#x
、%#X
:其他整数类型
C语言提供3个附属关键字修饰基本整数类型:
short
、long
和unsigned
。- short int类型(简写为short)占用的存储空间可能比int类型少,常用于较小数值的场合以节省空间。与int类似,short是有符号类型。
- long int或long占用的存储空间可能比int多,适用于较大数值的场合。与int类似,long是有符号类型。
- long long int或long long(C99标准加入)占用的储存空间可能比long多,适用于更大数值的场合。该类型至少占64位。与int类似,long long是有符号类型。
- unsigned int或unsigned只用于非负值的场合。这种类型与有符号类型表示的范围不同。例如,16位unsigned int允许的取值范围是0~65535。用于表示正负号的位现在用于表示另一个二进制位,所以无符号整型可以表示更大的数。
- 在C90标准中,添加了unsigned long int或unsigned long和unsigned int或unsigned short类型。C99标准又添加了unsigned long long int或unsigned long long。
- 在任何有符号类型前面添加关键字signed,可强调使用有符号类型的意图。例如,short、short int、signed short、signed short int都表示同一种类型。
为什么说short类型“可能”比int类型占用的空间少,long类型“可能”比int类型占用的空间多?
因为C语言只规定了short占用的存储空间不能多于int,long占用的存储空间不能少于int。这样规定是为了适应不同的机器。过去的一台运行Windows 3的机器上,int类型和short类型都占16位,long类型占32位。后来,Windows和苹果系统都使用16位储存short类型,32位储存int类型和long类型。现在,计算机普遍使用64位处理器,为了储存64位的整数,才引入了long long类型。
现在,个人计算机上最常见的设置是,long long占64位,long占32位,short占16位,int占16位或32位(依计算机的自然字长而定)。原则上,这4种类型代表4种不同的大小,但是在实际使用中,有些类型之间通常有重叠。
C 标准对基本数据类型只规定了允许的最小大小。对于 16 位机,short和 int 的最小取值范围是[−32767,32767];对于32位机,long的最小取值范围是[−2147483647,2147483647]。对于unsigned short和unsigned int,最小取值范围是[0,65535];对于unsigned long,最小取值范围是[0,4294967295]。long long类型是为了支持64位的需求,最小取值范围是[−9223372036854775807,9223372036854775807];unsigned long long的最小取值范围是[0,18446744073709551615]。
int类型那么多,应该如何选择?
首先,考虑unsigned类型。这种类型的数常用于计数,因为计数不用负数。而且,unsigned类型可以表示更大的正数。
如果一个数超出了int类型的取值范围,且在long类型的取值范围内时,使用long类型。然而,对于那些long占用的空间比int大的系统,使用long类型会减慢运算速度。因此,如非必要,请不要使用long类型。
注意:如果在long类型和int类型占用空间相同的机器上编写代码,当确实需要32位的整数时,应使用long类型而不是int类型,以便把程序移植到16位机后仍然可以正常工作。类似地,如果确实需要64位的整数,应使用long long类型。
如果在int设置为32位的系统中要使用16位的值,应使用short类型以节省存储空间。通常,只有当程序使用相对于系统可用内存较大的整型数组时,才需要重点考虑节省空间的问题。使用short类型的另一个原因是,计算机中某些组件使用的硬件寄存器是16位。
long常量和long long常量
通常,程序代码中使用的数字都被储存为int类型。如果超出了int类型能表示的范围,编译器会将其视为long int类型。如果数字超出long可表示的最大值,编译器则将其视为unsigned long类型。如果还不够大,编译器则将其视为long long或unsigned long long类型。
八进制和十六进制常量被视为int类型。如果值太大,编译器会尝试使用unsigned int。如果还不够大,编译器会依次使用long、unsigned long、long long和unsigned long long类型。
有些情况下,需要编译器以long类型储存一个小数字。例如,编程时要显式使用IBM PC上的内存地址时。另外,一些C标准函数也要求使用long类型的值。要把一个较小的常量作为long类型对待,可以在值的末尾加上l(小写的L)或L后缀。使用L后缀更好,因为l看上去和数字1很像。因此,在int为16位、long为32位的系统中,会把7作为16位储存,把7L作为32位储存。l或L后缀也可用于八进制和十六进制整数,如020L和0x10L。类似地,在支持long long类型的系统中,也可以使用ll或LL后缀来表示long long类型的值,如3LL。另外,u或U后缀表示unsigned long long,如5ull、10LLU、6LLU或9Ull。
打印short、long、long long和unsigned类型
打印unsigned int类型的值,使用
%u
转换说明;打印long类型的值,使用%ld
转换说明。如果系统中int和long的大小相同,使用%d
就行。但是,这样的程序被移植到其他系统(int和long类型的大小不同)中会无法正常工作。在x和o前面可以使用l前缀,
%lx
表示以十六进制格式打印long类型整数,%lo
表示以八进制格式打印long类型整数。注意,虽然C允许使用大写或小写的常量后缀,但是在转换说明中只能用小写。C语言有多种
printf()
格式。对于short类型,可以使用h
前缀。%hd
表示以十进制显示short类型的整数,%ho
表示以八进制显示short类型的整数。h和l前缀都可以和u一起使用,用于表示无符号类型。例如,%lu
表示打印unsigned long类型的值。对于支持long long类型的系统,%lld
和%llu
分别表示有符号和无符号类型。浮点数
浮点数与数学中实数的概念差不多。2.75、3.16E7、7.00 和 2e-8 都是浮点数。在一个值后面加上一个小数点,该值就成为一个浮点值。所以,7是整数,7.00是浮点数。书写浮点数有多种形式,e记数法:3.16E7表示。
浮点数和整数的储存方案不同。计算机把浮点数分成小数部分和指数部分来表示,而且分开储存这两部分。因此,虽然7.00和7在数值上相同,但是它们的储存方式不同。在十进制下,可以把7.0写成0.7E1。当然,计算机在内部使用二进制和2的幂进行储存,而不是10的幂。
浮点数可以表示的范围比整数大。
对于一些算术运算(如,两个很大的数相减),浮点数损失的精度更多。因为在任何区间内(如,1.0 到 2.0 之间)都存在无穷多个实数,所以计算机的浮点数不能表示区间内所有的值。浮点数通常只是实际值的近似值。例如,7.0可能被储存为浮点值6.99999。
过去,浮点运算比整数运算慢。不过,现在许多CPU都包含浮点处理器,缩小了速度上的差距。
整数类型对大多数软件开发项目而言够用了。然而,面向金融和数学的程序经常使用浮点数。C语言中的浮点类型有float、double和long double类型。
浮点数的表示类似于科学记数法:
第1列是一般记数法;第2列是科学记数法;第3列是指数记数法(或称为e记数法),这是科学记数法在计算机中的写法,e后面的数字代表10的指数。
C标准规定,
float
类型必须至少能表示6位有效数字,且取值范围至少是 ~。前一项规定指float类型必须至少精确表示小数点后的6位有效数字。后一项规定用于方便地表示诸如太阳质量、一个质子的电荷量或国家债务之类的数字。通常,系统储存一个浮点数要占用32位。其中8位用于表示指数的值和符号,剩下24位用于表示非指数部分(也叫作尾数或有效数)及其符号。C语言提供的另一种浮点类型是
double
(双精度)。double类型和float类型的最小取值范围相同,但至少必须能表示10位有效数字。一般情况下,double占用64位而不是32位。一些系统将多出的 32 位全部用来表示非指数部分,这不仅增加了有效数字的位数(即提高了精度),而且还减少了舍入误差。另一些系统把其中的一些位分配给指数部分,以容纳更大的指数,从而增加了可表示数的范围。无论哪种方法,double类型的值至少有13位有效数字,超过了标准的最低位数规定。C语言的第3种浮点类型是
long double
,以满足比double类型更高的精度要求。不过,C只保证long double类型至少与double类型的精度相同。浮点型常量
在代码中,可以用多种形式书写浮点型常量。浮点型常量的基本形式是:有符号的数字(包括小数点),后面紧跟e或E,最后是一个有符号数表示10的指数。
正号可以省略。可以没有小数点(如,2E5)或指数部分(如,19.28),但是不能同时省略两者。可以省略小数部分(如,3.E16)或整数部分(如,.45E-6),但是不能同时省略两者。
不要在浮点型常量中间加空格
默认情况下,编译器假定浮点型常量是double类型的精度。假设some是float类型的变量,编写下面的语句:
通常,4.0和2.0被储存为64位的
double
类型,使用双精度进行乘法运算,然后将乘积截断成float类型的宽度。这样做虽然计算精度更高,但是会减慢程序的运行速度。
在浮点数后面加上f或F后缀可覆盖默认设置,编译器会将浮点型常量看作float类型,如2.3f和9.11E9F。使用l或L后缀使得数字成为long double类型,如54.3l和4.32L。注意,建议使用L后缀,因为字母l和数字1很容易混淆。没有后缀的浮点型常量是double类型。
C99 标准添加了一种新的浮点型常量格式——用十六进制表示浮点型常量,即在十六进制数前加上十六进制前缀(0x或0X),用p和P分别代替e和E,用2的幂代替10的幂(即,p计数法)。
十六进制a等于十进制10,.1f是1/16加上15/256(十六进制f等于十进制15),p10是 或1024。0xa.1fp10表示的值是(10 + 1/16 +15/256)×1024(即,十进制10364.0)。
注:并非所有的编译器都支持C99的这一特性
打印浮点值
printf()
函数使用%f转换说明打印十进制记数法的float和double类型浮点数,用%e
打印指数记数法的浮点数。如果系统支持十六进制格式的浮点数,可用a和A分别代替e和E。打印long double
类型要使用%Lf
、%Le
或%La
转换说明。给那些未在函数原型中显式说明参数类型的函数(如,
printf()
)传递参数时,C编译器会把float
类型的值自动转换成double
类型。浮点值的上溢和下溢
当计算导致数字过大,超过当前类型能表达的范围时,就会发生上溢。这种行为在过去是未定义的,不过现在C语言规定,在这种情况下会赋一个表示无穷大的特定值,且
printf()
显示该值为inf或infinity(或具有无穷含义的其他内容)。
当除以一个很小的数时,情况更为复杂。float类型的数以指数和尾数部分来储存。存在这样一个数,它的指数部分是最小值,即由全部可用位表示的最小尾数值。该数字是float类型能用全部精度表示的最小数字。现在把它除以 2。通常,这个操作会减小指数部分,但是假设的情况中,指数已经是最小值了。所以计算机只好把尾数部分的位向右移,空出第1 个二进制位,并丢弃最后一个二进制数。以十进制为例,把一个有4位有效数字的数(如,0.1234E-10)除以10,得到的结果是0.0123E-10。虽然得到了结果,但是在计算过程中却损失了原末尾有效位上的数字。这种情况叫作下溢(underflow)。C语言把损失了类型全精度的浮点值称为低于正常的浮点值。因此,把最小的正浮点数除以 2将得到一个低于正常的值。如果除以一个非常大的值,会导致所有的位都为0。现在,C库已提供了用于检查计算是否会产生低于正常值的函数。
还有另一个特殊的浮点值NaN。例如,给
asin()
函数传递一个值,该函数将返回一个角度,该角度的正弦就是传入函数的值。但是正弦值不能大于1,因此,如果传入的参数大于1,该函数的行为是未定义的。在这种情况下,该函数将返回NaN值,printf()
函数可将其显示为nan、NaN或其他类似的内容。得出这些奇怪答案的原因是,计算机缺少足够的小数位来完成正确的运算。2.0e20是 2后面有20个0。如果把该数加1,那么发生变化的是第21位。要正确运算,程序至少要储存21位数字。而float类型的数字通常只能储存按指数比例缩小或放大的6或7位有效数字。在这种情况下,计算结果一定是错误的。另一方面,如果把2.0e20改成2.0e4,计算结果就没问题。因为2.0e4加1只需改变第5位上的数字,float类型的精度足够进行这样的计算。
char类型
char
类型用于储存字符(如字母或标点符号),但是从技术层面看,char
是整数类型。因为char
类型实际上储存的是整数而不是字符。计算机使用数字编码来处理字符,即用特定的整数表示特定的字符。例如,在ASCII码中,整数65代表大写字母A,储存字母A实际上储存的是整数65。标准ASCII码的范围是0~127,只需7位二进制数即可表示。通常,char类型被定义为8位的存储单元,因此容纳标准ASCII码绰绰有余。许多其他系统(如IMB PC和苹果Macs)还提供扩展ASCII码,也在8位的表示范围之内。一般而言,C语言会保证char类型足够大,以储存系统(实现C语言的系统)的基本字符集。
许多字符集都超过了127,甚至多于255。商用的统一码(Unicode)创建了一个能表示世界范围内多种字符集的系统,目前包含的字符已超过110000个。国际标准化组织(ISO)和国际电工技术委员会(IEC)为字符集开发了ISO/IEC 10646标准。统一码标准也与ISO/IEC 10646标准兼容。
C语言把1字节定义为char类型占用的位(bit)数,因此无论是16位还是32位系统,都可以使用char类型。
声明char类型变量
字符常量和初始化
非打印字符
单引号只适用于字符、数字和标点符号,浏览ASCII表会发现,有些ASCII字符打印不出来。例如,一些代表行为的字符(如退格、换行、终端响铃或蜂鸣)。C语言提供了3种方法表示这些字符。
- 第1种方法使用ASCII码。例如,蜂鸣字符的ASCII值是7,因此可以这样写:
- 第 2 种方法是,使用特殊的符号序列表示一些特殊的字符。这些符号序列叫作转义字符。
把转义序列赋给字符变量时,必须用单引号把转义序列括起来
- 从C90开始,不仅可以用十进制、八进制形式表示字符常量,C语言还提供了第3种选择——用十六进制形式表示字符常量,即反斜杠后面跟一个x或X,再加上1~3位十六进制数字。例如,Ctrl+P字符的ASCII十六进制码是10(相当于十进制的16),可表示为'\x10'或'\x010'。图3.5列出了一些整数类型的不同进制形式。
打印字符
一个字符变量实际上被储存为1字节的整数值。因此,如果用%d转换说明打印 char类型变量的值,打印的是一个整数。而%c转换说明告诉
printf()
打印该整数值对应的字符有符号还是无符号
有些C编译器把char实现为有符号类型,这意味着char可表示的范围是-128~127。而有些C编译器把char实现为无符号类型,那么char可表示的范围是0~255。查阅相应的编译器手册,确定编译器如何实现char类型。或者,可以查阅
limits.h
头文件。
根据C90标准,C语言允许在关键字char前面使用signed或unsigned。这样,无论编译器默认char是什么类型,signed char表示有符号类型,而unsigned char表示无符号类型。这在用char类型处理小整数时很有用。如果只用char处理字符,那么char前面无需使用任何修饰符字符串
字符串(character string)是一个或多个字符的序列,如下所示:
双引号不是字符串的一部分。双引号仅告知编译器它括起来的是字符串,正如单引号用于标识单个字符一样。
char类型数组和null字符
C语言没有专门用于储存字符串的变量类型,字符串都被储存在char类型的数组中。数组由连续的存储单元组成,字符串中的字符被储存在相邻的存储单元中,每个单元储存一个字符
数组末尾位置的字符\0。这是空字符(null character),C语言用它标记字符串的结束。空字符不是数字0,它是非打印字符,其ASCII码值是(或等价于)0。C中的字符串一定以空字符结束,这意味着数组的容量必须至少比待存储字符串中的字符数多1。因此,40个存储单元的字符串,只能储存39个字符,剩下一个字节留给空字符。
那么,什么是数组?可以把数组看作是一行连续的多个存储单元。用更正式的说法是,数组是同类型数据元素的有序序列。
使用字符串
字符串和字符
字符串常量"x"和字符常量'x'不同。区别之一在于'x'是基本类型(char),而"x"是派生类型(char数组);区别之二是"x"实际上由两个字符组成:'x'和空字符\0
strlen()函数
sizeof 运算符,它以字节为单位给出对象的大小。strlen()函数给出字符串中的字符长度。
sizeof运算符报告,name数组有40个存储单元。但是,只有前11个单元用来储存Serendipity,所以strlen()得出的结果是11。name数组的第12个单元储存空字符,strlen()并未将其计入。
对于 PRAISE,用 strlen()得出的也是字符串中的字符数(包括空格和标点符号)。然而,sizeof运算符给出的数更大,因为它把字符串末尾不可见的空字符也计算在内。该程序并未明确告诉计算机要给字符串预留多少空间,所以它必须计算双引号内的字符数。
C99 和 C11 标准专门为 sizeof 运算符的返回类型添加了%zd 转换说明,这对于strlen()同样适用。对于早期的C,还要知道sizeof和
strlen()
返回的实际类型(通常是unsigned或unsigned long)。另外,sizeof 圆括号的使用时机否取决于运算对象是类型还是特定量?运算对象是类型时,圆括号必不可少,但是对于特定量,可有可无。也就是说,对于类型,应写成sizeof(char)或sizeof(float);对于特定量,可写成sizeof name或sizeof 6.28。
_Bool类型
C99标准添加了
_Bool
类型,用于表示布尔值。因为C语言用值1表示true
,0表示false
,所以_Bool
类型实际上也是一种整数类型。但原则上它仅占用1位存储空间,因为对0和1而言,1位的存储空间足够了。可移植类型
C 语言提供了许多有用的整数类型。但是,某些类型名在不同系统中的功能不一样。C99 新增了两个头文件
stdint.h
和inttypes.h
,以确保C语言的类型在各系统中的功能相同。C语言为现有类型创建了更多类型名。这些新的类型名定义在
stdint.h
头文件中。例如,int32_t表示32位的有符号整数类型。在使用32位int的系统中,头文件会把int32_t作为int的别名。不同的系统也可以定义相同的类型名。例如,int为16位、long为32位的系统会把int32_t作为long的别名。然后,使用int32_t类型编写程序,并包含stdint.h
头文件时,编译器会把int或long替换成与当前系统匹配的类型。上面讨论的类型别名是精确宽度整数类型的示例。int32_t表示整数类型的宽度正好是32位。但是,计算机的底层系统可能不支持。因此,精确宽度整数类型是可选项。
如果系统不支持精确宽度整数类型怎么办?C99和C11提供了第2类别名集合。一些类型名保证所表示的类型一定是至少有指定宽度的最小整数类型。这组类型集合被称为最小宽度类型。例如,int_least8_t是可容纳8位有符号整数值的类型中宽度最小的类型的一个别名。如果某系统的最小整数类型是16位,可能不会定义int8_t类型。尽管如此,该系统仍可使用int_least8_t类型,但可能把该类型实现为16位的整数类型。
当然,一些程序员更关心速度而非空间。为此,C99和C11定义了一组可使计算达到最快的类型集合。这组类型集合被称为最快最小宽度类型。例如,int_fast8_t被定义为系统中对8位有符号值而言运算最快的整数类型的别名。
另外,有些程序员需要系统的最大整数类型。为此,C99定义了最大的有符号整数类型intmax_t,可储存任何有效的有符号整数值。类似地,unitmax_t表示最大的无符号整数类型。顺带一提,这些类型有可能比long long和unsigned long类型更大,因为C编译器除了实现标准规定的类型以外,还可利用C语言实现其他类型。例如,一些编译器在标准引入 long long 类型之前,已提前实现了该类型。
C99 和 C11 不仅提供可移植的类型名,还提供相应的输入和输出。例如,
printf()
打印特定类型时要求与相应的转换说明匹配。如果要打印int32_t类型的值,有些定义使用%d,而有些定义使用%ld,怎么办?C 标准针对这一情况,提供了一些字符串宏来显示可移植类型。例如, inttypes.h
头文件中定义了PRId32字符串宏,代表打印32位有符号值的合适转换说明(如d或l)。复数和虚数类型
许多科学和工程计算都要用到复数和虚数。C99 标准支持复数类型和虚数类型,但是有所保留。一些独立实现,如嵌入式处理器的实现,就不需要使用复数和虚数(VCR芯片就不需要复数)。一般而言,虚数类型都是可选项。C11标准把整个复数软件包都作为可选项。
简而言之,C语言有3种复数类型:float_Complex、double_Complex和long double _Complex。例如,float _Complex类型的变量应包含两个float类型的值,分别表示复数的实部和虚部。类似地, C语言的3种虚数类型是float_Imaginary、double _Imaginary和long double _Imaginary。
如果包含
complex.h
头文件,便可用complex代替_Complex,用imaginary代替_Imaginary,还可以用I代替-1的平方根。为何 C 标准不直接用 complex 作为关键字来代替_Complex,而要添加一个头文件?因为标准委员会考虑到,如果使用新的关键字,会导致以该关键字作为标识符的现有代码全部失效。例如,之前的 C99,许多程序员已经使用 struct complex 定义一个结构来表示复数或者心理学程序中的心理状况(关键字struct用于定义能储存多个值的结构)。让complex成为关键字会导致之前的这些代码出现语法错误。但是,使用struct _Complex的人很少,特别是标准使用首字母是下划线的标识符作为预留字以后。因此,标准委员会选定_Complex作为关键字,在不用考虑名称冲突的情况下可选择使用complex。