http://blog.csdn.net/cuishumao/article/details/10284463

一 说明
(1)应用情况:比如基于socket来实现http协议等,这时候就需要解析URL。
(2)为了移植性,没有用非标准C库windows下的StrDup(linux下为strdup),用自己编写的dup_str。
(3)编译环境:windows ,visual studio2010
二 URL的格式:
(协议)://(主机名):(端口号) / (文件路径)/(文件名) 
  例如:http://zj.qq.com/a/20130824/002507.htm#p=8
      http://www.itpub.net/kwrss/201211/wangzhiduankou.shtml
三 实现

  1. #include <stdio.h>     //printf
  2. #include <string.h>    //strchr strncmp ,memcpy
  3. #include <malloc.h>    //malloc free
  4. #include <stdlib.h>    //atoi
  5. //将source开始空间的以NULL结尾的字符拷贝到dest中
  6. //返回的指针需要free
  7. char*dup_str(const char*source)
  8. {
  9. if(source==NULL)
  10. return  NULL;
  11. int len = strlen(source);
  12. char *dest = (char*)malloc(len+1);
  13. memcpy(dest,source,len+1);
  14. return dest;
  15. }
  16. //函数功能:解析URL
  17. //参数:host带回主机字符串,protocl协议,port端口,abs_path带回绝对路径
  18. //使用完注意释放host和abs_path在堆上分配的内存
  19. //备注:(1)先取到URL的一份拷贝,方面将该字符串截成几段,分别处理;
  20. //      (2)用了指针引用,也可以使用二重指针来解决参数带回值的问题
  21. void parse_URL(const char*URL,const char*protocl,char*&host,unsigned int &port,char*&abs_path)
  22. {
  23. if(URL == NULL)
  24. return ;
  25. char *url_dup = dup_str(URL);
  26. char *p_slash = NULL;//主机后第一个斜杠的位置
  27. char *p_colon = NULL;//主机后第一个冒号的位置
  28. char *start = 0;    //记录www开始的位置
  29. if(strncmp(url_dup,protocl,strlen(protocl))==0)
  30. {
  31. start = url_dup+strlen(protocl)+3;
  32. p_slash = strchr(start,'/');
  33. if(p_slash != NULL)
  34. {
  35. abs_path= dup_str(p_slash);
  36. *p_slash = '\0';
  37. }
  38. else
  39. {
  40. abs_path= dup_str("/");
  41. }
  42. p_colon = strchr(start,':');
  43. if(p_colon != NULL)
  44. {
  45. port = atoi(p_colon+1);
  46. *p_colon = '\0';
  47. }
  48. else
  49. port = 8080;//没有的话取默认的8080端口
  50. }
  51. host = dup_str(start);
  52. }
  53. if(url_dup != NULL)
  54. {
  55. free(url_dup);
  56. url_dup = NULL;
  57. }
  58. }
  59. int main()
  60. {
  61. //这是一个伪造的地址,用于测试
  62. //char *URL = "http://www.xyz2013.com";
  63. //char *URL = "ftp://www.xyz2013.com:8080";
  64. char *URL = "https://www.xyz2013.com:1324/My/5201449.shtml";
  65. char*abs_path = NULL;
  66. char*host = NULL;
  67. unsigned int port;
  68. parse_URL(URL,"https",host,port,abs_path);
  69. printf("主机地址:%s\n",host);
  70. printf("端口号:%d\n",port);
  71. printf("绝对路径:%s\n",abs_path);
  72. //需要释放host,abs_path
  73. if(host!=NULL)
  74. {
  75. free(host);
  76. host = NULL;
  77. }
  78. if(abs_path!=NULL)
  79. {
  80. free(abs_path);
  81. abs_path=NULL;
  82. }
  83. getchar();
  84. }

结果:

[转]URL的解析,C语言实现的更多相关文章

  1. URL的解析,C语言实现

    源: URL的解析,C语言实现 c语言实现urlencode和decode

  2. 巨蟒python全栈开发django4:url反向解析图解&&模板渲染

    第一部分: 1.(1)知识点回顾: django回顾: ()下载安装 输入网址,a,form表单get post,爬虫 (请求)==>django项目服务端的url(r"index/& ...

  3. python 之 Django框架(路由系统、include、命名URL和URL反向解析、命名空间模式)

    12.36 Django的路由系统 基本格式: from django.conf.urls import url urlpatterns = [ url(正则表达式, views视图函数,参数,别名) ...

  4. phpcms V9 MVC模式 与 URL访问解析

    [1]URL访问解析 观察访问网页时的网址,可以得出模块访问方法,如下示例: http://www.abcd.com.cn/phpcms/index.php?m=content&c=index ...

  5. atitit.java解析sql语言解析器解释器的实现

    atitit.java解析sql语言解析器解释器的实现 1. 解析sql的本质:实现一个4gl dsl编程语言的编译器 1 2. 解析sql的主要的流程,词法分析,而后进行语法分析,语义分析,构建sq ...

  6. phpcms(1)phpcms V9 MVC模式 与 URL访问解析(转)

    [1]URL访问解析 观察访问网页时的网址,可以得出模块访问方法,如下示例: http://www.abcd.com.cn/phpcms/index.php?m=content&c=index ...

  7. django的url反向解析

    目的:防止页面中url地址改变,其他与这个URL地址有关联的都要改,减少耦合度 使用:主要分为在html中和视图函数中的使用 HTML中的使用: 如果我们在项目的url文件中通过include导入了应 ...

  8. Django url配置 正则表达式详解 分组命名匹配 命名URL 别名 和URL反向解析 命名空间模式

    Django基础二之URL路由系统 本节目录 一 URL配置 二 正则表达式详解 三 分组命名匹配 四 命名URL(别名)和URL反向解析 五 命名空间模式 一 URL配置 Django 1.11版本 ...

  9. Django url反向解析与路由分发名称空间

    url反向解析 url.py from django.conf.urls import url from django.contrib import admin from app01 import v ...

  10. rails中path、url路径解析,routes信息,form_for剖析,link_to示例,路由实例说明

    原创,转载请注明http://www.cnblogs.com/juandx/p/3963023.html  rails中path.url路径解析,routes信息,form_for剖析,link_to ...

随机推荐

  1. eclipse 中导入 maven项目 启动报错

    导入Maven项目到Eclipse中时,出现问题如下: java.lang.ClassNotFoundException: org.springframework.web.context.Contex ...

  2. 前端MVC学习笔记(四)——NodeJS+MongoDB+AngularJS+Bootstrap书店示例

    这章的目的是为了把前面所学习的内容整合一下,这个示例完成一个简单图书管理模块,因为中间需要使用到Bootstrap这里先介绍Bootstrap. 示例名称:天狗书店 功能:完成前后端分离的图书管理功能 ...

  3. 《如何阅读一本书》(How to Read a Book)

    值得一读的书,有深入浅出,也有并不能完全读懂的部分,以下是第11章对之前内容的总结整理. 阅读的层次 1. 基础阅读 2. 检视阅读 3. 分析阅读 4. 主题阅读 分析阅读 第一阶段:这本书在谈些什 ...

  4. HDU1496 hash

    Equations Time Limit: 6000/3000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)Total S ...

  5. 【转】关于JVM CPU资源占用过高的问题排查

    http://my.oschina.net/shipley/blog/520062 一.背景: 先执行一个java程序里面开了两个线程分别都在while循环做打印操作. ? 1 # java -cp  ...

  6. php学习笔记——CSS缓存问题

    PHP也没学多久,在工作中遇到了一个问题,先来记录一下. 问题描述: 同一项目里面的不同模块对应了不同的网站,但是两个网站用的文件名以是同一规范的,最后导致了两个网站css文件同名,在打开了网站A后去 ...

  7. JavaEE XML DOM创建之DOM4J

    DOM4J创建xml文档 @author ixenos 1 写出内容到xml文档 XMLWriter writer = new XMLWriter(OutputStream, OutputForamt ...

  8. usaco 2.2.4 生日派对灯(最近写题碰到的,虽然知道现在写这个有点晚了)

    经过分析,他看似很多的开灯的方法其实合并起来就只有八个. 首先,一个开关在执行的时候只能按一次(因为你就算按了两次就相当于一次也没有按). 当一个都不按的时候  当然就只有一种:不按. 当按一下的时候 ...

  9. Objective-C Runtime 运行时之三:方法与消息(转载)

    前面我们讨论了Runtime中对类和对象的处理,及对成员变量与属性的处理.这一章,我们就要开始讨论Runtime中最有意思的一部分:消息处理机制.我们将详细讨论消息的发送及消息的转发.不过在讨论消息之 ...

  10. WinForm笔记一:文本框只允许输入数字

    在WinForm的文本框中,有时候只允许数字,而不能输入除数字以外的其他字符,要调用TextBox的KeyPress事件,代码如下: //只允许输入数字 if (e.KeyChar<'0'||e ...