织梦CMS - 轻松建站从此开始!

罗索

用C语言进行CGI程序设计

jackyhwei 发布于 2011-08-05 11:26 点击:次 
这篇文章的目的,也就是要你了解一下CGI编程的概念。在进行服务器端编程的时候,一般都会首先考虑使用ASP,PHP,JSP等脚本编程语言。只有当他们也解决不了,比如要进行一些更为底层的编程的时候,才会用到CGI。
TAG:

一、CGI概述
CGI(公用网关接口)规定了Web服务器调用其他可执行程序(CGI程 序)的接口协议标准。Web服务器通过调用CGI程序实现和Web浏览器的交互,也就是CGI程序接受Web浏览器发送给Web服务器的信息,进行处理, 将响应结果再回送给Web服务器及Web浏览器。CGI程序一般完成Web网页中表单(Form)数据的处理、数据库查询和实现与传统应用系统的集成等工 作。CGI程序可以用任何程序设计语言编写,如Shell脚本语言、Perl、Fortran、Pascal、C语言等。但是用C语言编写的CGI程序具 有执行速度快、安全性高(因为C语言程序是编译执行且不可被修改)等特点。
CGI接口标准包括标准输入、环境变量、标准输出三部分。
1.标准输入
CGI程序像其他可执行程序一样,可通过标准输入(stdin)从Web服务器得到输入信息,如Form中的数据,这就是所谓的向CGI程序传递数据的 POST方法。这意味着在操作系统命令行状态可执行CGI程序,对CGI程序进行调试。POST方法是常用的方法,本文将以此方法为例,分析CGI程序设 计的方法、过程和技巧。
2.环境变量
操作系统提供了许多环境变量,它们定义了程序的执行环境,应用程序可以存取它们。Web服务器和CGI接口又另外设置了自己的一些环境变量,用来向CGI 程序传递一些重要的参数。CGI的GET方法还通过 环境变量QUERY-STRING向CGI程序传递Form中的数据。
3.标准输出
CGI程序通过标准输出(stdout)将输出信息传送给Web服务器。传送给Web服务器的信息可以用各种格式,通常是以纯文本或者HTML文本的形式,这样我们就可以在命令行状态调试CGI程序,并且得到它们的输出。
下面是一个简单的CGI程序,它将HTML中Form的信息直接输出到We b浏览器。

  1. #include <stdio.h> 
  2. #include <stdib.h> 
  3. main() 
  4.   int,i,n; 
  5.    printf (″Contenttype:text/plainnn″); 
  6.    n=0; 
  7.    if(getenv(″CONTENT-LENGTH″)) 
  8.    n=atoi(getenv(CONTENT-LENGTH″)); 
  9.    for (i=0;i<n;i++) 
  10.    putchar(getchar()); 
  11.    putchar (′n′); 
  12.    fflush(stdout); 
  13. }  

   下面对此程序作一下简要的分析。
prinft (″Contenttype:text/plainnn″);
此行通过标准输出将字符串″Contenttype:text/plainnn″传送给Web服务器。它是一个MIME头信息,它告诉Web服务器随后的 输出是以纯ASCII文本的形式。请注意在这个头信息中有两个新行符,这是因为Web服务器需要在实际的文本信息开始之前先看见一个空行。
if (getenv(″CONTENT-LENGTH″))
n=atoi (getenv(″CONTENT-LENGTH″));
此行首先检查环境变量CONTENT-LENGTH是否存在。Web服务器在调用使用POST方法的CGI程序时设置此环境变量,它的文本值表示Web服 务器传送给CGI程序的输入中的字符数目,因此我们使用函数atoi() 将此环境变量的值转换成整数,并赋给变量n。请注意Web服务器并不以文件结束符来终止它的输出,所以如果不检查环境变量CONTENT-LENGTH, CGI程序就无法知道什么时候输入结束了。
for (i=0;i<n;i++)
putchar(getchar());
此行从0循环到(CONTENT-LENGTH-1)次将标准输入中读到的每一个字符直接拷贝到标准输出,也就是将所有的输入以ASCII的形式回送给Web服务器。
通过此例,我们可将CGI程序的一般工作过程总结为如下几点。
1.通过检查环境变量CONTENT-LENGTH,确定有多少输入;
2.循环使用getchar()或者其他文件读函数得到所有的输入;
3.以相应的方法处理输入;
4.通过″Contenttype:″头信息,将输出信息的格式告诉Web服务器;
5.通过使用printf()或者putchar()或者其他的文件写函数,将输出传送给Web服务器。
总之,CGI程序的主要任务就是从Web服务器得到输入信息,进行处理,然后将输出结果再送回给Web服务器。
二、环境变量
环境变量是文本串(名字/值对),可以被OS Shell或其他程序设置 ,也可以被其他程序访问。它们是Web服务器传递数据给CGI程序的简单手段,之所以称为环境变量是因为它们是全局变量,任何程序都可以存取它们。

下面是CGI程序设计中常常要用到的一些环境变量。
HTTP-REFERER:调用该CGI程序的网页的URL。
REMOTE-HOST:调用该CGI程序的Web浏览器的机器名和域名。
REQUEST-METHOD:指的是当Web服务器传递数据给CGI程序时所采用的方法,分为GET和POST两种方法。GET方法仅通过环境变量(如 QUERY-STRING)传递数据给CGI程序,而POST方法通过环境变量和标准输入传递数据给CGI程序,因此POST方法可较方便地传递较多的数 据给CGI程序。

SCRIPT-NAME:该CGI程序的名称。
QUERY-STRING:当使用POST方法时,Form中的数据最后放在QUERY-STRING中,传递给CGI程序。
CONTENT-TYPE:传递给CGI程序数据的MIME类型,通常为″applica tion/x-www-form-url encodede″,它是从HTML Form中以POST方法传递数据给CGI程序的数据编码类型,称为URL编码类型。
CONTENT-LENGTH:传递给CGI程序的数据字符数(字节数)。
在C语言程序中,要访向环境变量,可使用getenv()库函数。例如:
if (getenv (″CONTENT-LENGTH″))
n=atoi(getenv (″CONTENT-LENGTH″));
请注意程序中最好调用两次getenv():第一次检查是否存在该环境变量,第二次再使用该环境变量。这是因为函数getenv()在给定的环境变量名不 存在时,返回一个NULL(空)指针,如果你不首先检查而直接引用它,当该环境变量不存在时会引起CGI程序崩溃。

三、From输入的分析和解码
1.分析名字/值对
当用户提交一个HTML Form时,Web浏览器首先对Form中的数据以名字/值对的形式进行编码,并发送给Web服务器,然后由Web服务器传递给CGI程序。其格式如下:
name1=value1&name2=value2&name3=value3&name4=value4&...
其中名字是Form中定义的INPUT、SELECT或TEXTAREA等标置(Tag)名字,值是用户输入或选择的标置值。这种格式即为URL编码,程 序中需要对其进行分析和解码。要分析这种数据流,CGI程序必须首先将数据流分解成一组组的名字/值对。这可以通过在输入流中查找下面的两个字符来完成。
每当找到字符=,标志着一个Form变量名字的结束;每当找到字符& ,标志着一个Form变量值的结束。请注意输入数据的最后一个变量的值不以&结束。
一旦名字/值对分解后,还必须将输入中的一些特殊字符转换成相应的ASCII字符。这些特殊字符是:
+:将+转换成空格符;
%xx:用其十六进制ASCII码值表示的特殊字符。根据值xx将其转换成相应的ASCII字符。
对Form变量名和变量值都要进行这种转换。下面是一个对Form数据进行分析并将结果回送给Web服务器的CGI程序。

  1. #include <stdio.h> 
  2. #include <stdlib.h> 
  3. #include <strings.h> 
  4. int htoi(char *); 
  5.  
  6. main() 
  7.    int i,n; 
  8.    char c; 
  9.    printf (″Contenttype: text/plainnn″); 
  10.    n=0; 
  11.    if (getenv(″CONTENT-LENGTH″)) 
  12.     n=atoi(getenv(″CONTENT-LENGTH″)); 
  13.    for (i=0; i<n;i++){ 
  14.     int is-eq=0; 
  15.    c=getchar(); 
  16.    switch (c){ 
  17.     case ′&′: 
  18.      c=′n′; 
  19.      break
  20.     case ′+′: 
  21.      c=′ ′; 
  22.      break
  23.     case ′%′:{ 
  24.      char s[3]; 
  25.      s[0]=getchar(); 
  26.      s[1]=getchar(); 
  27.      s[2]=0; 
  28.      c=htoi(s); 
  29.      i+=2; 
  30.     } 
  31.     break
  32.    case ′=′: 
  33.     c=′:′; 
  34.     is-eq=1; 
  35.     break
  36.    }; 
  37.    putchar(c); 
  38.    if (is-eq) putchar(′ ′); 
  39.    } 
  40.    putchar (′n′); 
  41.    fflush(stdout); 
  42.    } 
  43.    /* convert hex string to int */ 
  44.    int htoi(char *s) 
  45.    { 
  46.     char *digits=″0123456789ABCDEF″; 
  47.    if (islower (s[0])) s[0]=toupper(s[0]); 
  48.    if (islower (s[1])) s[1]=toupper(s[1]); 
  49.    return 16 * (strchr(digits, s[0]) -strchr (digits,′0′) 
  50.    +(strchr(digits,s[1])-strchr(digits,′0′)); 
  51. }  

上面的程序首先输出一个MIME头信息给Web服务器,检查输入中的字符数,并循环检查每一个字符。当发现字符为&时,意味着一个名字/值对的结 束,程序输出一个空行;当发现字符为+时,将它转换成空格; 当发现字符为%时,意味着一个两字符的十六进制值的开始,调用htoi()函数将随后的两个字符转换为相应的ASCII字符;当发现字符为=时,意味着一 个名字/值对的名字部分的结束,并将它转换成字符:。最后将转换后的字符输出给Web服务器。
四、产生HTML输出
CGI程序产生的输出由两部分组成:MIME头信息和实际的信息。两部分之间以一个空行分开。我们已经看到怎样使用MIME头信息″Cont enttype:text/plainnn″和printf()、put char()等函数调用来输 出纯ASCII文本给Web服务器。实际上,我们也可以使用MIME头信息″C ontenttype:text/htmlnn″来输出HTML源代码给Web服务器。请注意任何MIME头信息后必须有一个空行。一旦发送这个MIME 头信息给We b服务器后,Web浏览器将认为随后的文本输出为HTML源代码,在HTML源代码中可以使用任何HTML结构,如超链、图像、Form,及对其他CGI 程 序的调用。也就是说,我们可以在CGI程序中动态产生HTML源代码输出 ,下面是一个简单的例子。

  1. #include <stdio.h> 
  2. #include <string.h> 
  3. main() 
  4.    printf(″Contenttype:text/html\n\n″); 
  5.    printf(″<html>\n″); 
  6.    printf(″<head><title>An HTML Page From a CGI</title></head>\n″); 
  7.    printf(″<body>\n″); 
  8. printf(″<h2> This is an HTML page generated from with i n a CGI program..   .</h2>\n″); 
  9.    printf(″<hr><p>\n″); 
  10.    printf(″<a href="../output.html#two"><b> Go back to out put.html page </b></a>\n″); 
  11.    printf(″</body>\n″); 
  12.    printf(″</html>\n″); 
  13.    fflush(stdout); 
  14. }  

上面的CGI程序简单地用printf()函数来产生HTML源代码。请注意在输出的字符串中如果有双引号,在其前面必须有一个后斜字符, 这是因为整个HTML代码串已经在双引号内,所以HTML代码串中的双引号符必须用一个后斜字符来转义。
在 HTML中,当客户填写了表单,并按下了发送(submit)按钮后,表单的内容被发送到了服务器端,一般的,这时就需要有一个服务器端脚本来对表单的 内容进行一些处理,或者是把它们保存起来,或者是按内容进行一些查询,或者是一些别的什么。没有了CGI,WEB的世界就完全失去了它的交互性,所有的信 息都变成单向的了,而不能够有任何的反馈。
有的人认为可以用java script来代替CGI程序,这其实是一个概念上的错误。java script只能够在客户浏览器中运行,而CGI却是工作在服务器上的。他们所做的工作有一些交集,比如表单数据验证一类的,但是java script是绝对无法取代CGI的。但可以这样说,如果一项工作即能够用java script来做,又可以用CGI来做,那么绝对要使用java script,在执行的速度上,java script比CGI有着先天的优势。只有那些在客户端解决不了的问题,比如和某个远程数据库交互,这时就应该使用CGI了。
简单的说来,CGI是用来沟通HTML表单和服务器端程序的接口(interface)。说它是接口,也就是说CGI并不是一种语言,而是可以被其他语言 所应用的一个规范集。理论上讲,你可以用任何的程序语言来编写CGI程序,只要在编程的时候符合CGI规范所定义的一些东西就可以了。由于C语言在平台无 关性上表现不错(几乎在任何的系统平台下都有其相应编译器),而且对大多数程序员而言都算得上很熟悉(不像Perl),因此,C是CGI编程的首选语言之 一。这儿我们介绍的,就是如何使用C来编写CGI程序。
作为CGI编程的最为简单的例子,就是进行表单的处理。因而在这篇文章中,我们主要介绍的就是如何用C来编写CGI程序来进行表但处理。
GET表单的处理
对于那些使用了属性“METHOD=GET”的表单(或者没有METHOD属性,这时候GET是其缺省值),CGI定义为:当表单被发送到服务器断后,表 单中的数据被保存在服务器上一个叫做QUERY_STRING的环境变量中。这种表单的处理相对简单,只要读取环境变量就可以了。这一点对不同的语言有不 同的做法。在C语言中,你可以用库函数getenv(定义在标准库函数stdlib中)来把环境变量的值作为一个字符串来存取。你可以在取得了字符串中的 数据后,运用一些小技巧进行类型的转换,这都是比较简单的了。在CGI程序中的标准输出(output)(比如在C中的stdout文件流)也是经过重定 义了的。它并没有在服务器上产生任何的输出内容,而是被重定向到客户浏览器。这样,如果编写一个C的CGI程序的时候,把一个HTML文档输出到它的 stdout上,这个HTML文档会被在客户端的浏览器中显示出来。这也是CGI程序的一个基本原理。
我们来看看具体的程序实现,下面是一段HTML表单:
< form ACTION="/cgi-bin/mult.cgi" >
< P >请在下面填入乘数和被乘数,按下确定后可以看到结果。
< INPUT NAME="m" SIZE="5" >
< INPUT NAME="n" SIZE="5" >< BR >
< INPUT TYPE="SUBMIT" values="确定" >
< /form >
我们要实现的功能很简单,就是把表单中输入的数值乘起来,然后输出结果。其实这个功能完全可以用java script来实现,但为了让程序尽量的简单易懂,我还是选择了这个小小的乘法来作为示例。
下面就是处理这个表单的CGI程序,对应于form标签中的ACTION属性值。

  1. #include < stdio.h > 
  2. #include < stdlib.h > 
  3.  
  4. int main(void
  5. char *data; 
  6. long m,n; 
  7. printf("%s%c%c ","Content-Type:text/html;charset=gb2312",13,10); 
  8. printf("< TITLE >乘法结果< /TITLE > "); 
  9. printf("< H3 >乘法结果< /H3 > "); 
  10. data = getenv("QUERY_STRING"); 
  11. if(data == NULL) 
  12.   printf("< P >错误!数据没有被输入或者数据传输有问题"); 
  13. else if(sscanf(data,"m=%ld&n=%ld",&m,&n)!=2) 
  14.   printf("< P >错误!输入数据非法。表单中输入的必须是数字。"); 
  15. else 
  16.   printf("< P >%ld和%ld的成绩是:%ld。",m,n,m*n); 
  17.  
  18. return 0; 
  19. }  

具体的C语法就不多讲了,我们来看看它作为CGI程序所特殊的地方。
前面已经提到标准输出的内容就是要被显示在浏览器中的内容。第一行的输出内容是必须的,也是一个CGI程序所特有的:printf("%s%c%c ","Content-Type:text/html",13,10),这个输出是作为HTML的文件头。因为CGI不仅可以像浏览器输出HTML文本, 而且可以输出图像,声音之类的东西。这一行告诉浏览器如何处理接受到的内容。在Content-Type的定义后面跟有两行的空行,这也是不可缺少的。因 为所有CGI程序的头部输出都是相近的,因而可以为其定义一个函数,来节省编程的时间。这是CGI编程常用的一个技巧。
程序在后面调用了用了库函数getevn来得到QUERY_STRING的内容,然后使用sscanf函数把每个参数值取出来,要注意的是sscanf函数的用法。其他的就没有什么了,和一般的C程序没有区别。
把程序编译后,改名为mult.cgi放在/cgi-bin/目录下面,就可以被表单调用了。这样,一个处理GET方式表单的CGI程序就大功告成了。
(wind20)

本站文章除注明转载外,均为本站原创或编译欢迎任何形式的转载,但请务必注明出处,尊重他人劳动,同学习共成长。转载请注明:文章转载自:罗索实验室 [http://www.rosoo.net/a/201108/14800.html]
本文出处:blog.csdn.net/wind20 作者:wind20
顶一下
(2)
100%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片
栏目列表
将本文分享到微信
织梦二维码生成器
推荐内容