C语言是一门面向过程、抽象化的通用程式设计语言,广泛套用于底层开发。C语言能以简易的方式编译、处理低级存储器。C语言是仅产生少量的机器语言以及不需要任何运行环境支持便能运行的高效率程式设计语言。儘管C语言提供了许多低级处理的功能,但仍然保持着跨平台的特性,以一个标準规格写出的C语言程式可在包括一些类似嵌入式处理器以及超级计算机等作业平台的许多计算机平台上进行编译。
基本介绍
- 中文名C语言
- 外文名The C Programming Language
- 类别程式设计语言
- 创始人Dennis MacAlistair Ritchie
- 创始时间1972年
- 发源BCPL语言
- 主要编译器Visual C++、Clang、GCC、Turbo C等
- 启发语言BCPL、彙编语言、ALGOL68等
- 作业系统跨平台
基本简介
C语言是一门面向过程的计算机程式语言,与C++、Java等面向对象程式语言有所不同。C语言的设计目标是提供一种能以简易的方式编译、处理低级存储器、仅产生少量的机器码以及不需要任何运行环境支持便能运行的程式语言。C语言描述问题比彙编语言迅速,工作量小、可读性好,易于调试、修改和移植,而代码质量与彙编语言相当。C语言一般只比彙编语言代码生成的目标程式效率低10%~20%。,C语言可以编写系统软体。
二十世纪八十年代,美国国家标準局为了避免各开发厂商用的C语言语法产生差异,给C语言制定了一套完整的美国国家标準语法,称为ANSI C。作为C语言最初的标準。2011年12月8日,国际标準化组织(ISO)和国际电工委员会(IEC)发布的C11标準是C语言的第三个官方标準,也是C语言的最新标準,该标準更好的支持了汉字函式名和汉字标识符,一定程度上实现了汉字编程。
C语言编译器普遍存在于各种不同的作业系统中,例如Microsoft Windows, Mac OS X, Linux, Unix等。C语言的设计影响了众多后来的程式语言,例如C++、Objective-C、Java、C#等。
发展历史
C语言之所以命名为C,是因为 C语言源自Ken Thompson发明的B语言,而 B语言则源自BCPL语言。
1967年,剑桥大学的Martin Richards对CPL语言进行了简化,于是产生了BCPL(Basic Combined Programming Language)语言。
20世纪60年代,美国AT&T公司贝尔实验室(AT&T Bell Laboratory)的研究员Ken Thompson闲来无事,手痒难耐,想玩一个他自己编的,模拟在太阳系航行的电子游戏——Space Travel。他背着老闆,找到了台空闲的机器——PDP-7。但这台机器没有作业系统,而游戏必须使用作业系统的一些功能,于是他着手为PDP-7开发作业系统。后来,这个作业系统被命名为——UNIX。
1970年,美国贝尔实验室的 Ken Thompson,以BCPL语言为基础,设计出很简单且很接近硬体的B语言(取BCPL的首字母)。并且他用B语言写了第一个UNIX作业系统。
1971年,同样酷爱Space Travel的Dennis M.Ritchie为了能早点儿玩上游戏,加入了Thompson的开发项目,合作开发UNIX。他的主要工作是改造B语言,使其更成熟。
1972年,美国贝尔实验室的 D.M.Ritchie 在B语言的基础上最终设计出了一种新的语言,他取了BCPL的第二个字母作为这种语言的名字,这就是C语言。
1973年初,C语言的主体完成。Thompson和Ritchie迫不及待地开始用它完全重写了UNIX。此时,编程的乐趣使他们已经完全忘记了那个"Space Travel",一门心思地投入到了UNIX和C语言的开发中。随着UNIX的发展,C语言自身也在不断地完善。直到今天,各种版本的UNIX核心和周边工具仍然使用C语言作为最主要的开发语言,其中还有不少继承Thompson和Ritchie之手的代码。
在开发中,他们还考虑把UNIX移植到其他类型的计算机上使用。C语言强大的移植性(Portability)在此显现。机器语言和彙编语言都不具有移植性,为x86开发的程式,不可能在Alpha,SPARC和ARM等机器上运行。而C语言程式则可以使用在任意架构的处理器上,只要那种架构的处理器具有对应的C语言编译器和库,然后将C原始码编译、连线成目标二进制档案之后即可运行。
1977年,Dennis M.Ritchie发表了不依赖于具体机器系统的C语言编译文本《可移植的C语言编译程式》。
C语言继续发展,在1982年,很多有识之士和美国国家标準协会为了使这个语言健康地发展下去,决定成立C标準委员会,建立C语言的标準。委员会由硬体厂商,编译器及其他软体工具生产商,软体设计师,顾问,学术界人士,C语言作者和应用程式员组成。1989年,ANSI发布了第一个完整的C语言标準——ANSI X3.159—1989,简称“C89”,不过人们也习惯称其为“ANSI C”。C89在1990年被国际标準组织ISO(International Standard Organization)一字不改地採纳,ISO官方给予的名称为ISO/IEC 9899,所以ISO/IEC9899: 1990也通常被简称为“C90”。1999年,在做了一些必要的修正和完善后,ISO发布了新的C语言标準,命名为ISO/IEC 98991999,简称“C99”。在2011年12月8日,ISO又正式发布了新的标準,称为ISO/IEC9899: 2011,简称为“C11”。
编程开发
编译器
GCC,GNU组织开发的开源免费的编译器
MinGW,Windows作业系统下的GCC
Clang,开源的BSD协定的基于LLVM的编译器
Visual C++ :: cl.exe,Microsoft VC++自带的编译器
集成开发环境
Code::Blocks,开源免费的C/C++ IDE
CodeLite,开源、跨平台的C/C++集成开发环境
Dev-C++,可移植的C/C++IDE
C-Free
Light Table
Visual Studio系列
第一个程式
下面是一个在标準输出设备 (stdout) 上,印出 "Hello, world!" 字元串的简单程式。类似的程式,通常作为初学程式语言时的第一个程式
#include <stdio.h>int main(){printf("Hello, World! \n"); return 0;}
事例
- 程式的第一行#include <stdio.h>是预处理器指令,告诉 C 编译器在实际编译之前要包含 stdio.h 档案。
- 下一行int main()是主函式,程式从这里开始执行。
- 下一行printf(...)是 C 中另一个可用的函式,会在萤幕上显示讯息 "Hello, World!"。
- 下一行return 0;终止 main() 函式,并返回值 0。
语言标準
起初,C语言没有官方标準。1978年由美国电话电报公司(AT&T)贝尔实验室正式发表了C语言。布莱恩·柯林汉(Brian Kernighan) 和 丹尼斯·里奇(Dennis Ritchie) 出版了一本书,名叫《The C Programming Language》。这本书被 C语言开发者们称为K&R,很多年来被当作 C语言的非正式的标準说明。人们称这个版本的 C语言为K&R C。
K&R C主要介绍了以下特色
结构体(struct)类型
长整数(long int)类型
无符号整数(unsigned int)类型
把运算符=+和=-改为+=和-=。因为=+和=-会使得编译器不知道使用者要处理i = -10还是i =- 10,使得处理上产生混淆。
即使在后来ANSI C标準被提出的许多年后,K&R C仍然是许多编译器的最 準要求,许多老旧的编译器仍然运行K&R C的标準。
1970到80年代,C语言被广泛套用,从大型主机到小型微机,也衍生了C语言的很多不同版本。
1983年,美国国家标準协会(ANSI)成立了一个委员会X3J11,来制定 C语言标準。
1989年,美国国家标準协会(ANSI)通过了C语言标準,被称为ANSI X3.159-1989 "Programming Language C"。因为这个标準是1989年通过的,所以一般简称C89标準。有些人也简称ANSI C,因为这个标準是美国国家标準协会(ANSI)发布的。
1990年,国际标準化组织(ISO)和国际电工委员会(IEC)把C89标準定为C语言的国际标準,命名为ISO/IEC 9899:1990 - Programming languages -- C。因为此标準是在1990年发布的,所以有些人把简称作C90标準。不过大多数人依然称之为C89标準,因为此标準与ANSI C89标準完全等同。
1994年,国际标準化组织(ISO)和国际电工委员会(IEC)发布了C89标準修订版,名叫ISO/IEC 9899:1990/Cor 1:1994,有些人简称为C94标準。
1995年,国际标準化组织(ISO)和国际电工委员会(IEC)发布了C89标準修订版,名叫ISO/IEC 9899:1990/Amd 1:1995 - C Integrity,有些人简称为C95标準。
C99标準
1999年1月,国际标準化组织(ISO)和国际电工委员会(IEC)发布了C语言的新标準,名叫ISO/IEC 9899:1999 - Programming languages -- C ,简称C99标準。这是C语言的第二个官方标準。
在C99中包括的特性有
- 增加了对编译器的限制,比如源程式每行要求至少支持到 4095 位元组,变数名函式名的要求支持到 63 位元组(extern 要求支持到 31)。
- 增强了预处理功能。例如
- 宏支持取可变参数 #define Macro(...) __VA_ARGS__
- 使用宏的时候,允许省略参数,被省略的参数会被扩展成空串。
- 支持 // 开头的单行注释(这个特性实际上在C89的很多编译器上已经被支持了)
增加了新关键字 restrict, inline, _Complex, _Imaginary, _Bool
- 支持 long long, long double _Complex, float _Complex 等类型
支持不定长的数组,即数组长度可以在运行时决定,比如利用变数作为数组长度。声明时使用 int a[var] 的形式。不过考虑到效率和实现,不定长数组不能用在全局,或 struct 与 union 里。
变数声明不必放在语句块的开头,for 语句提倡写成 for(int i=0;i<100;++i) 的形式,即i 只在 for 语句块内部有效。
允许採用(type_name){xx,xx,xx} 类似于 C++ 的构造函式的形式构造匿名的结构体。
複合字面量初始化结构的时候允许对特定的元素赋值,形式为
struct test{int a[3],b;} foo[] = { [0].a = {1}, [1].a = 2 };
struct test{int a, b, c, d;} foo = { .a = 1, .c = 3, 4, .b = 5 }; // 3,4 是对 .c,.d 赋值的
- 格式化字元串中,利用 \u 支持 unicode 的字元。
- 支持 16 进制的浮点数的描述。
- printf scanf 的格式化串增加了对 long long int 类型的支持。
- 浮点数的内部数据描述支持了新标準,可以使用 #pragma 编译器指令指定。
- 除了已有的 __line__ __file__ 以外,增加了 __func__ 得到当前的函式名。
- 允许编译器化简非常数的表达式。
- 修改了 /% 处理负数时的定义,这样可以给出明确的结果,例如在C89中-22 / 7 = -3, -22% 7 = -1,也可以-22 / 7= -4, -22% 7 = 6。 而C99中明确为 -22 / 7 = -3, -22% 7 = -1,只有一种结果。
- 取消了函式返回类型默认为 int 的规定。
- 允许 struct 定义的一个数组不指定其长度,写做 [](flexible array member)。
- const const int i 将被当作 const int i 处理。
- 增加和修改了一些标準头档案,比如定义 bool 的 <stdbool.h> ,定义一些标準长度的 int 的 <inttypes.h> ,定义複数的 <complex.h> ,定义宽字元的 <wctype.h> ,类似于泛型的数学函式 <tgmath.h>, 浮点数相关的 <fenv.h>。 在<stdarg.h> 增加了 va_copy 用于複製 ... 的参数。里增加了 struct tmx ,对 struct tm 做了扩展。
- 在C89只允许使用/.../形式的注释,而C++则允许使用//形式的注释,//形式的注释被称为C++风格。但许多C编译系统再C99之前就已经支持这种方便的注释方法,C99正式将//形式的注释纳入C语言的标準。
- 输入输出对宽字元以及长整数等做了相应的支持。
C11标準
- 对齐处理(Alignment)的标準化(包括_Alignas标誌符,alignof运算符, aligned_alloc函式以及<stdalign.h>头档案。
- _Noreturn 函式标记,类似于 gcc 的 __attribute__((noreturn))。
- _Generic 关键字。
- 多执行绪(Multithreading)支持,包括
- _Thread_local存储类型标识符,<threads.h>头档案,里面包含了执行绪的创建和管理函式。
- _Atomic类型修饰符和<stdatomic.h>头档案。
增强的Unicode的支持。基于C Unicode技术报告ISO/IEC TR 19769:2004,增强了对Unicode的支持。包括为UTF-16/UTF-32编码增加了char16_t和char32_t数据类型,提供了包含unicode字元串转换函式的头档案<uchar.h>.
删除了 gets() 函式,使用一个新的更安全的函式gets_s()替代。
增加了边界检查函式接口,定义了新的安全的函式,例如 fopen_s(),strcat_s() 等等。
增加了更多浮点处理宏。
匿名结构体/联合体支持。这个在gcc早已存在,C11将其引入标準。
静态断言(static assertions),_Static_assert(),在解释 #if 和 #error 之后被处理。
新的 fopen() 模式,(“…x”)。类似 POSIX 中的 O_CREAT|O_EXCL,在档案锁中比较常用。
新增 quick_exit() 函式作为第三种终止程式的方式。当 exit()失败时可以做最少的清理工作。
语言特点
基本特性
特有特点
- C语言是一个有结构化程式设计、具有变数作用域(variable scope)以及递归功能的过程式语言。
- C语言传递参数均是以值传递(pass by value),也可以传递指针(a pointer passed by value)。
- 不同的变数类型可以用结构体(struct)组合在一起。
- 只有32个保留字(reserved keywords),使变数、函式命名有更多弹性。
- 部份的变数类型可以转换,例如整型和字元型变数。
- 通过指针(pointer),C语言可以容易的对存储器进行低级控制。
- 预编译处理(preprocessor)让C语言的编译更具有弹性。
优缺点
C11新特性
语言组成
基本构成
关键字
流程控制关键字
编译
语法结构
顺序结构
选择结构
循环结构
程式结构
判断语句(选择结构)
循环语句(循环结构)
跳转语句(循环结构是否循环)
书写规则
函式
运算符号
()、 []、 -> 、 .、!、 ++、 -- | 圆括弧、方括弧、指针、成员、逻辑非、自加、自减 |
++ 、 -- 、 、 & 、 ~ 、! | 单目运算符 |
+、 - 、 sizeof、(cast) | |
、 / 、% | 算术运算符 |
+ 、 - | 算术运算符 |
<< 、 >> | 位运算符 |
< 、 <= 、 > 、 >= | 关係运算符 |
== 、!= | 关係运算符号 |
& | 位与 |
^ | 位异或 |
| | 位或 |
&& | 逻辑与 |
|| | 逻辑或 |
? 、: | 条件运算符 |
/= 、%= 、 &= 、 |= 、 ^= | 赋值运算符 |
= 、 += 、 -= 、 = 、 | |
, | 顺序运算符 |
经典错误
void main()的用法并不是任何标準制定的。 C语言标準语法是int main,任何实现都必须支持int main(void) { / ... / }和int main(int argc, char argv[]) { / ... / }。
类似于a+=a++;或者(i++)+(i++)+(i++)属于未定义行为,并不是说c语言中还未定义这种行为,它早有定论,它的结果取决于编译器实现,不要写这样的代码!