CGI 是Web 伺服器运行时外部程式的规范,按CGI 编写的程式可以扩展伺服器功能。CGI 应用程式能与浏览器进行互动,还可通过资料库API 与资料库伺服器等外部数据源进行通信,从资料库伺服器中获取数据。格式化为HTML文档后,传送给浏览器,也可以将从浏览器获得的数据放到资料库中。几乎所有伺服器都支持CGI,可用任何语言编写CGI,包括流行的C、C ++、VB 和Delphi 等。CGI 分为标準CGI 和间接CGI两种。标準CGI 使用命令行参数或环境变数表示伺服器的详细请求,伺服器与浏览器通信採用标準输入输出方式。间接CGI 又称缓冲CGI,在CGI 程式和CGI 接口之间插入一个缓冲程式,缓冲程式与CGI 接口间用标準输入输出进行通信。
基本介绍
- 中文名公共网关接口
- 外文名Common Gateway Interface
- 特点外部应用程式
- 功能用来解释处理来自表单的输入信息
公共网关接口
CGI(Common Gateway Interface) 是WWW技术中最重要的技术之一,有着不可替代的重要地位。CGI是外部应用程式(CGI程式)与WEB伺服器之间的接口标準,是在CGI程式和Web伺服器之间传递信息的过程。CGI规范允许Web伺服器执行外部程式,并将它们的输出传送给Web浏览器,CGI将Web的一组简单的静态超媒体文档变成一个完整的新的互动式媒体。
Common Gateway Interface,简称CGI。在物理上是一段程式,运行在伺服器上,提供同客户端HTML页面的接口。这样说大概还不好理解。那幺我们看一个实际例子现在的个人主页上大部分都有一个留言本。留言本的工作是这样的先由用户在客户端输入一些信息,如评论之类的东西。接着用户按一下“发布或提交”(到目前为止工作都在客户端),浏览器把这些信息传送到伺服器的CGI目录下特定的CGI程式中,于是CGI程式在伺服器上按照预定的方法进行处理。在本例中就是把用户提交的信息存入指定的档案中。然后CGI程式将执行结果返回给伺服器(webServer),然后伺服器将结果返回给客户端,表示请求的任务已经结束。此时用户在浏览器里将看到“留言结束”的字样。整个过程结束。
功能
绝大多数的CGI程式被用来解释处理来自表单的输入信息,并在伺服器产生相应的处理,或将相应的信息反馈给浏览器。CGI程式使网页具有互动功能。
运行环境
CGI程式最初在UNIX作业系统上CERN或NCSA格式的伺服器上运行。
作业系统
Windows NT及Windows 95的伺服器上也广泛地使用CGI程式,它也适用于各种类型机器。
处理步骤
⑴通过Internet把用户请求送到web伺服器。
⑵web伺服器接收用户请求并交给CGI程式处理。
⑶CGI程式把处理结果传送给web伺服器。
⑷web伺服器把结果送回到用户。
编写语言
CGI可以用任何一种语言编写,只要这种语言具有标準输入、输出和环境变数。对初学者来说,最好选用易于归档和能有效表示大量数据结构的语言,例如UNIX环境中
· Perl (Practical Extraction and Report Language)
· Bourne Shell或者Tcl (Tool Command Language)
· PHP(Hypertext Preprocessor))
由于C语言有较强的平台无关性,所以也是编写CGI程式的首选。
Windows环境中
· C和C++
由于Internet上大部分伺服器使用的是UNIX作业系统,且几乎任一UNIX作业系统中都有Bourne Shell,因而大部分实现脚本都是用Bourne Shell编写的。
最终Perl由于其跨作业系统、易于修改的特性成为了CGI的主流编写语言,以至于一般的“cgi程式”就是Perl程式。
伺服器配置
CGI程式不是放在伺服器上就能顺利运行,如果要想使其在伺服器上顺利的运行并準确的处理用户的请求,则须对所使用的伺服器进行必要的设定。
配置根据所使用的伺服器类型以及它的设定把CGI程式放在某一特定的目录中或使其带有特定的扩展名。
⑴CERN格式伺服器的配置
编辑CERN格式伺服器(起初其被命名为“CERN httpd”, 也被称为“W3C httpd”)的配置档案(通常为/etc/httpd.conf)在档案中加入Exec cgi-bin//home/www/cgi-bin/.exec。命令中出现的第一个参数cgi-bin/指出了在URL中出现的目录名字,并表示它出现在系统主机后的第一个目录中,如http://edgar.stern.nyn./cgi-bin/。命令中的第二个参数表示CGI程式目录放在系统中的真实路径。
CGI目录除了可以跟网路档案放在同一目录中,也可以放在系统的其它目录中,但必须保证在你的系统中也具有同样的目录。在对伺服器完成设定后,须重新启动伺服器(除非HTTP伺服器是用inetd启动的)。
⑵NCSA格式伺服器的配置
在NCSA格式伺服器上有两种方法进行设定
①在srm.conf档案(通常在conf目录下)中加入Script Alias/cgi-bin/cgi-bin/。Script Alias命令指出某一目录下的档案是可执行程式,且这个命令是用来执行这些程式的;此命令的两个参数与CERN格式伺服器中的Exec命令的参数的含意一样。
②在srm.conf档案加入Add type application/x-httpd-cgi.cgi。此命令表示在伺服器上增加了一种新的档案类型,其后第一个参数为CGI程式的MIME类型,第二个参数是档案的扩展名,表示以这一扩展名为扩展名的档案是CGI程式。
在用上述方法之一设定伺服器后,都得重新启动伺服器(除非HTTP伺服器是用inetd启动的)。
环境变数列表
SERVER_NAME运行CGI序为机器名或IP位址。
SERVER_INTERFACEWWW伺服器的类型,如CERN型或NCSA型。
SERVER_PROTOCOL通信协定,应当是HTTP/1.0。
SERVER_PORTTCP连线埠,一般说来web连线埠是80。
HTTP_ACCEPTHTTP定义的浏览器能够接受的数据类型。
HTTP_REFERER传送表单的档案URL。(并非所有的浏览器都传送这一变数)
HTTP_USER-AGENT传送表单的浏览的有关信息。
GETWAY_INTERFACECGI程式的版本,在UNIX下为 CGI/1.1。
PATH_TRANSLATEDPATH_INFO中包含的实际路径名。
PATH_INFO浏览器用GET方式传送数据时的附加路径。
SCRIPT_NAMECGI程式的路径名。
QUERY_STRING表单输入的数据,URL中问号后的内容。
REMOTE_HOST传送程式的主机名,不能确定该值。
REMOTE_ADDR传送程式的机器的IP位址。
REMOTE_USER传送程式的人名。
CONTENT_TYPEPOST传送,一般为application/xwww-form-urlencoded。
CONTENT_LENGTHPOST方法输入的数据的位元组数。
优点
CGI可以为我们提供许多HTML无法做到的功能。比如 a.一个记数器 b.顾客信息表格的提交以及统计 c.搜寻程式 d.WEB资料库,用Html是没有办法记住客户的任何信息的,就算用户愿意让你知道。用Html也是无法把信息记录到某一个特定档案里的。要把客户端的信息记录在伺服器的硬碟上,就要用到CGI。这是CGI最重要的作用,它补充了Html的不足。是的,仅仅是补充,不是替代。
使在网路伺服器下运行外部分应用程式(或网关)成为可能。CGI-BIN 目录是存放CGI脚本的地方。这些脚本使Web伺服器和浏览器能运行外部程式,而无需启动另一个程式。
它是运行在Web伺服器上的一个程式,并由来自于浏览者的输入触发。CGI是在HTTP伺服器下运行外部程式(或网关)的一个接口,它能让网路用户访问远程系统上的使用类型程式,就好像他们在实际使用那些远程计算机一样。
CGI能够让浏览者与伺服器进行互动,如果你曾经遇到过在网路上填表或者进行搜寻,就很有可能就是用的CGI。
儘管CGI易于使用,当大批人使用一个CGI应用程式是会反应较慢,网路伺服器 速度也会受到很大 影响。CGI应用程式的优点是可以独立运行。
CGI应用程式可以由大多数的程式语言编写,如Perl(Practical Extraction and Report Language)、C\C++、Java 和Visual Basic等。不过对于那些没有太多编程经验的网页製作人来说,实在是一个不小的难题。
工作原理
1.浏览器通过HTML表单或超连结请求指向一个CGI应用程式的URL。
2.伺服器收发到请求。
3.伺服器执行指定CGI应用程式。
4.CGI应用程式执行所需要的操作,通常是基于浏览者输入的内容。
5.CGI应用程式把结果格式化为网路伺服器和浏览器能够理解的文档(通常是HTML网页)。
6.网路伺服器把结果返回到浏览器中。
注意的问题
CGI应用程式运行在浏览器可以请求的伺服器系统上,执行时需要使用伺服器CPU时间和记忆体。如果有成千上万的这种程式会运行,那会对伺服器系统提出极高的要求。你要慎重考虑这个问题,以防止伺服器系统崩溃。
不完善的CGI应用程式可能成为别人非法进人伺服器系统的通道,有可能导致重要的资料被删除或外泄。CGI应用程式主要的用途有以下几种
根据浏览者填写的HTML表单传送定製的答覆;
创建可单击的图像缩小图;
创建一个浏览者可以搜寻内容的资料库;
提供伺服器与资料库的接口,并把结果转换成HTML文档;
製作动态HTML文挡。
如果一个CGI脚本可以在每台计算机上做同样的事情;编写脚本就会变的很容易。不幸的是,CGI脚本依赖于伺服器的作业系统,,对于非UNIX伺服器来说,Prl(UNIX下编写脚本的一个常用工具)脚本毫无用处。所以,你必须定製安装你的CGI脚本。
大多数伺服器都提供CGI-BIN目录,这还不够。因为你应该拥有自己的CGI-BIN。这样,你就能运行自己的脚本(而不是让自己的系统去适应已存在于系统上的脚本)。,你的提供商应安装CGI-BIN,且能够帮助你编写脚本
ASP
ASP(Active Server Pages)活动伺服器页面,就是一个编程环境,在其中,可以混合使用HTML、脚本语言以及组件来创建伺服器端功能强大的Internet应用程式。如果你以前创建过一个站点,其中混合了HTML、脚本语言以及组件,你就可以在其中加入ASP程式代码。通过在HTML页面中加入脚本命令,你可以创建一个HTML用户界面,并且,还可以通过使用组件包含一些商业逻辑规则。组件可以被脚本程式调用,也可以由其他的组件调用。
ASP的工作原理
当在Web站点中融入ASP功能后,将发生以下事情
1、用户调出站点内容,默认页面的扩展名是.asp。
2、浏览器从伺服器上请求ASP档案。
3、伺服器端脚本开始运行ASP。
4、ASP档案按照从上到下的顺序开始处理,执行脚本命令,执行HTML页面内容。
5、页面信息传送到浏览器。
因为脚本是在伺服器端运行的,所以Web伺服器完成所有处理后,将标準的HTML页面送往浏览器。这意味着,ASP只能在可以支持的伺服器上运行。让脚本驻留在伺服器端的一个益处是用户不可能看到原始脚本程式的代码,用户看到的,仅仅是最终产生的HTML内容。
PHP:Hypertext Preprocessor
PHP 是一种伺服器端的,嵌入HTML的脚本语言。PHP区别其他像客户端Javascript的地方是它的代码在伺服器端执行.PHP能做什幺?
最低水平,PHP可以做任何其他CGI程式所能做的事,例如收集表格数据,生成动态页面内容,或者收发cookies.可能最强大,最有意义的特性是PHP支持大範围的资料库。书写一个支持资料库的Web 页面是难以置信的简单。
下面是当前支持的资料库
Adabas D InterBase Solid
dBase mSQL Sybase
Empress MySQL Velocis
FilePro Oracle Unix dbm
Informix PostgreSQL
PHP通过协定也支持与其他服务的"交谈",像IMAP、SNMP、NNTP、POP3,甚至是 HTTP。你也可以打开晦涩的 网路接口和其他协定互动。
PHP的简要历史
1994年秋季,Rasmus Lerdorf 开始构思 PHP。早期的非发行版本被用在他的主页上,以追蹤谁在看他的线上简历。1995年年初第一版本出台,当时PHP只被认为是个人主页开发工具。它由一个非常单纯的只能理解很少数特殊宏的分析引擎和 一些用在主页后端通用的工具组成,如留言簿,计数器和其他一些东西。这个分析器在1995年年中被重写并被命名为 PHP/FI 第二版。FI来自 Rasmus 写的一个包,用于解释 html 形式的数据.他结合了个人主页工具脚本和形式解析器,并加 上mSQL支持.这样就产生 PHP/FI 了. PHP/FI以令人惊奇的步调成长,人们开始把自己的代码贡献给它。
很难给出它的硬统计表,但可以估计在1996年末,整个世界至少有15,000个网站在用PHP/FI。到1997年年中,这个数字已经超过50,000了,而在此时PHP的发展也发生了变化。由Rasmus自己偏爱的和几个人开发的项目变成一个更有组织的团 体成就。Zeev Suraski和Andi Gutmans重写了解析器。这个新的解析器成为PHP版本3的基础。许多有用的代码从PHP/FI 继承到PHP3,并且很多是完全重写的。
今天(1999年年中)不管是PHP/FI或PHP3与很多商业产品捆绑在一块,例如C2级强度的Web伺服器和红帽子Linux。根据NetCraft提供的数据推断,保守估计全世界套用PHP的网站已超过150,000个。由此看来,它比在网际网路上运行Netscape 的旗舰企业伺服器的站点还多。