在2.6.24之后这个结构体有了较大的变化,此处先说一说2.6.16版本的sk_buff,以及解释一些问题。

一、

先直观的看一下这个结构体~~~~~~~~~~~~~~~~~~~~~~在下面解释每个字段的意义~~~~~~~~~~~

  1. struct sk_buff {
  2. /* These two members must be first. */
  3. struct sk_buff          *next;
  4. struct sk_buff          *prev;
  5. struct sock             *sk;
  6. struct skb_timeval      tstamp;
  7. struct net_device       *dev;
  8. struct net_device       *input_dev;
  9. union {
  10. struct tcphdr   *th;
  11. struct udphdr   *uh;
  12. struct icmphdr  *icmph;
  13. struct igmphdr  *igmph;
  14. struct iphdr    *ipiph;
  15. struct ipv6hdr  *ipv6h;
  16. unsigned char   *raw;
  17. } h;
  18. union {
  19. struct iphdr    *iph;
  20. struct ipv6hdr  *ipv6h;
  21. struct arphdr   *arph;
  22. unsigned char   *raw;
  23. } nh;
  24. union {
  25. unsigned char   *raw;
  26. } mac;
  27. struct  dst_entry       *dst;
  28. struct  sec_path        *sp;
  29. /*
  30. * This is the control buffer. It is free to use for every
  31. * layer. Please put your private variables there. If you
  32. * want to keep them across layers you have to do a skb_clone()
  33. * first. This is owned by whoever has the skb queued ATM.
  34. */
  35. char                    cb[48];
  36. unsigned int            len,
  37. data_len,
  38. mac_len,
  39. csum;
  40. __u32                   priority;
  41. __u8                    local_df:1,
  42. cloned:1,
  43. ip_summed:2,
  44. nohdr:1,
  45. nfctinfo:3;
  46. __u8                    pkt_type:3,
  47. fclone:2,
  48. ipvs_property:1;
  49. __be16                  protocol;
  50. void                    (*destructor)(struct sk_buff *skb);
  51. #ifdef CONFIG_NETFILTER
  52. __u32                   nfmark;
  53. struct nf_conntrack     *nfct;
  54. #if defined(CONFIG_NF_CONNTRACK) || defined(CONFIG_NF_CONNTRACK_MODULE)
  55. struct sk_buff          *nfct_reasm;
  56. #endif
  57. #ifdef CONFIG_BRIDGE_NETFILTER
  58. struct nf_bridge_info   *nf_bridge;
  59. #endif
  60. #endif /* CONFIG_NETFILTER */
  61. #ifdef CONFIG_NET_SCHED
  62. __u16                   tc_index;       /* traffic control index */
  63. #ifdef CONFIG_NET_CLS_ACT
  64. __u16                   tc_verd;        /* traffic control verdict */
  65. #endif
  66. #endif
  67. /* These elements must be at the end, see alloc_skb() for details.  */
  68. unsigned int            truesize;
  69. atomic_t                users;
  70. unsigned char           *head,
  71. *data,
  72. *tail,
  73. *end;
  74. };

> : next和prev,这两个域是用来连接相关的skb的(例如如果有分片,将这些分片连接在一起可以)

> : sk,指向报文所属的套接字指针

> : tstamp,记录接收或者传输报文的时间戳

> : dev和input_dev,记录接收或者发送的设备

>: union u,对于一个层次,例如tcp层,可能有很多不同的协议,他们的协议头不一样,那么这个联合体就是记录这些协议头的。

此处u就是代表传输层

> : union nh,代表网络层头

> : union mac,代表链路层头

> : dst,指向des_entry结构,记录了到达目的地的路由信息,以及其他的一些网络特征信息。

> : sp:安全路径,用于xfrm

> : cb[],保存与协议相关的控制信息,每个协议可能独立使用这些信息。

> : 重要的字段 len 和 data_len:

len代: 表整个数据区域的长度!这里要提前解释几个定义,skb的组成是有sk_buff控制 + 线性数据 + 非线性数据

(skb_shared_info) 组成!

后面会具体解释是什么意思!在sk_buff这个里面没有实际的数据,这里仅仅是控制信息,数据是通过后面的data指针指向其他内

存块的!那个内存块中是线性数据和

非线性数据!那么len就是length(线性数据) + length(非线性数据)!!!

data_len: 指的是length(非线性数据)!!!那么可以知道:length(线性数据) =  skb->len - skb->data_len

> : mac_len,指的是mac头长度

> : csum,某时刻协议的校验和

> : priority,报文排队优先级,取决于ip中的tos域

> : local_df,允许在本地分配

> : cloned,保存当前的skb_buff是克隆的还是原始数据

> : ip_summed,是否计算ip校验和

> : nohdr,仅仅引用数据区域

> : pkt_type,报文类型,例如广播,多播,回环,本机,传出...

> : fclone,skb_buff克隆状态

> : ipvs_property,skb_buff是否属于ipvs

> : protocal,协议信息

> : nfmark,用于钩子之间通信

> : nfct_reasm,netfilter的跟踪连接重新组装指针

> : nf_bridge,保存桥接信息

> : tc_index: Traffic control index,tc_verd: traffic control verdict

> : truesize,该缓冲区分配的所有总的内存,包括:skb_buff + 所有数据大小

> : users,保存引用skb_buff的数量

> : 重要数据字段:head,data,tail,end!!!

head:指向分配给的线性数据内存首地址( 建立起一个观念:并不是分配这么多内存,就都能被使用作为数据存储,可能没这么多

数据也有可能!但是也不要认为分配这么多 就足够了,也不一定(非线性数据就是例子) )

data:指向保存数据内容的首地址!我们由head可以知道,head和data不一定就是指在同一个位置!!!

tail:指向数据的结尾!

end:指向分配的内存块的结尾! ( 由上面我们知道数据结尾 != 分配的内存块的结尾 )

下面还会具体分析!!!!!!!!!!!

二、

我觉得需要先了解一些对于一个数据skb到底有什么,或者说由哪些元素组成!这就需要知道所谓的 “线性数据” 和 “非线性数据”。

基本的组成如下:

> : sk_buff : 这是一个sk_buff的控制结构

> : 线性数据区域

> : 非线性数据区域( 由skb_shared_info结构体管理 )

那么下面通过一个图来看看这个skb结构到底是怎么样的!看(图一)

  (图一)

借助图一,我们先来分析两个重要字段:len和data_len

之前说过len代表的是整个数据的长度,data_len代表的是非线性数据长度。我们由图一可以看到线性数据长度为l1,再看看非线性数据,其实就是看frags[]和frag_list

ok...那么我们可以知道非线性数据长度为( l2 + ... + ln ) + ( l(n+1) + ... + lm )

即:len = l1 + ( l2 + ... + ln ) + ( l(n+1) + ... + lm )

data_len = ( l2 + ... + ln ) + ( l(n+1) + ... + lm )

ok...

现在从分配内存开始解释这个图的由来:

我们使用skb_alloc给skb分配空间,那么刚刚分配结束返回时候,是什么样的情况呢?看下图(图二):

  (图二)

刚刚开始初始化的时候,预分配一个一块线性数据区域,这个区域一般放入的是各个协议层次的不同的头,还有一些实际数据,下面的非线性区域是为了弥补当数据真的很多的时候,作为数据区域的扩展!关于skb_shared_info具体意思下面会继续说!注意在初始化的时候,head,data和tail都指向内存的开始位置,head在这个位置始终不变,它表示的是分配的内存的开始位置。end的位置也是不变的,表示的是分配的内存的结束位置。data和tail会随着数据的加入和减少变化,总之表示的是放入数据的内存区域(由图一)可知。

现在需要解释一下skb_shared_info这个结构体,这个结构体真的是很很有特色!主要是其中的两个字段frags和frag_list,下面继续解释:

  1. struct skb_shared_info {
  2. atomic_t        dataref;        // 对象被引用次数
  3. unsigned short  nr_frags;       // 分页段数目,即frags数组元素个数
  4. unsigned short  tso_size;
  5. unsigned short  tso_segs;
  6. unsigned short  ufo_size;
  7. unsigned int    ip6_frag_id;
  8. struct sk_buff  *frag_list;    // 一般用于分段(还没有非常清楚的理解)
  9. skb_frag_t      frags[MAX_SKB_FRAGS]; // 保存分页数据(skb->data_len=所有的数组数据长度之和)
  10. };

关于frags和frag_list没有必然的联系!

> : 对于frags[]一般用在,当数据真的很多,而且在线性数据区域装不下的时候,需要使用这个,skb_frag_t中是一页一页的数据,先看看结构体:

  1. struct skb_frag_struct {
  2. struct page *page;    // 代表一页数据
  3. __u16 page_offset;    // 代表相对开始位置的页偏移量
  4. __u16 size;           // page中数据长度
  5. };

需要注意的是:只有在DMA支持物理分散页的Scatter/Gather(SG,分散/聚集)操作时候才可以使用frags[]来保存剩下的数据,否则,只能扩展线性数据区域进行保存!!!

这些页其实是其实就是虚拟页映射到物理页的结构,看下图(图三):

  (图三)

> : 对于frag_list来说,一般我们在分片的时候里面装入每个片的信息,注意,每个片最终也都是被封装成一个小的skb,这个必须

的!

注意:具体怎么分片的看上一篇博文:数据分片 (  看其中的ip_fragment函数  )

那么看一下其基本结构如图四:

    (图四)

 

三、

最重要的是需要理解对于这个skb是怎么操作的,在操作的过程中,每一块的内存分配是怎么变化的,这才更重要!

看下面的函数们:

> : alloc_skb()函数

  1. static inline struct sk_buff *alloc_skb(unsigned int size,
  2. gfp_t priority)
  3. {
  4. return __alloc_skb(size, priority, 0);
  5. }

其实看__alloc_skb函数:

  1. struct sk_buff *__alloc_skb(unsigned int size, gfp_t gfp_mask,
  2. int fclone)
  3. {
  4. kmem_cache_t *cache;
  5. struct skb_shared_info *shinfo;
  6. struct sk_buff *skb;
  7. u8 *data;
  8. cache = fclone ? skbuff_fclone_cache : skbuff_head_cache;    // 根据克隆状态来判断在哪一个缓冲区进行分配cache
  9. /* Get the HEAD */
  10. skb = kmem_cache_alloc(cache, gfp_mask & ~__GFP_DMA);        // 得到skb,注意这里没有包含数据,仅仅是skb_buff这个结构体
  11. if (!skb)
  12. goto out;
  13. /* Get the DATA. Size must match skb_add_mtu(). */
  14. size = SKB_DATA_ALIGN(size);                                     // 获得线性数据分片长度(注意对齐)
  15. data = kmalloc(size + sizeof(struct skb_shared_info), gfp_mask); // 注意分配的是什么,是size + skb_shared_info!!!!!
  16. if (!data)
  17. goto nodata;
  18. memset(skb, 0, offsetof(struct sk_buff, truesize));          // 初始化
  19. skb->truesize = size + sizeof(struct sk_buff);               // 实际大小等于sk_buff + size,刚刚开始还没有非线性数据
  20. atomic_set(&skb->users, 1);
  21. skb->head = data;                                            // 注意指针,这个结合上面的图一清二楚
  22. skb->data = data;
  23. skb->tail = data;
  24. skb->end  = data + size;
  25. /* make sure we initialize shinfo sequentially */
  26. shinfo = skb_shinfo(skb);
  27. atomic_set(&shinfo->dataref, 1);
  28. shinfo->nr_frags  = 0;
  29. shinfo->tso_size = 0;
  30. shinfo->tso_segs = 0;
  31. shinfo->ufo_size = 0;
  32. shinfo->ip6_frag_id = 0;
  33. shinfo->frag_list = NULL;
  34. if (fclone) {
  35. struct sk_buff *child = skb + 1;
  36. atomic_t *fclone_ref = (atomic_t *) (child + 1);
  37. skb->fclone = SKB_FCLONE_ORIG;
  38. atomic_set(fclone_ref, 1);
  39. child->fclone = SKB_FCLONE_UNAVAILABLE;
  40. }
  41. out:
  42. return skb;
  43. nodata:
  44. kmem_cache_free(cache, skb);
  45. skb = NULL;
  46. goto out;
  47. }

那么alloc之后的图就是(图五):

   (图五)

其实和图二是一样的!我们可以看到,现在仅仅是分配了线束数据区域,但是现在还没有数据!一定要注意!所以前面三个指针指在一起!因为没有数据,那么len和data_len的值就是0 !

> : skb_reserve函数

  1. static inline void skb_reserve(struct sk_buff *skb, int len)
  2. {
  3. skb->data += len;
  4. skb->tail += len;
  5. }

代码其实很easy、就是移动两个指针而已~

这个函数很重要,是为“协议头”预留空间!而且是尽最大的空间预留,因为很多头都会有可选项,那么我们不知道可选项是多大,所以只能是按照最大的分配,那么也说明了一点,预留的空间headroom也就是不一定都能使用完的!可能还有剩余的,由上面的图也可以看出来!这也是为什么需要这么多指针的问题!那么这个函数直接导致head指针和tail、data指针分离,入下面图六所示:

    (图六)

注意headroom就是用来存储各个协议头的足够大的空间,tailroom就可以认为是存储其他线性数据的空间。( 这里不要曲解协议头不是线性数据,其实协议头也是!!!所以当增加头的时候,data指针向上移动,当增加其他数据的时候,tail指针向下移动 )。现在data和tail指向一起,那么还是说明数据没有!!!

> : skb_put函数 ----> 用于操作线性数据区域(tailroom区域)的用户数据

  1. static inline unsigned char *skb_put(struct sk_buff *skb, unsigned int len)
  2. {
  3. unsigned char *tmp = skb->tail;
  4. SKB_LINEAR_ASSERT(skb);
  5. skb->tail += len;                 // 移动指针
  6. skb->len  += len;                 // 数据空间增大len
  7. if (unlikely(skb->tail>skb->end)) // 如果tail指针超过end指针了,那么处理错误~
  8. skb_over_panic(skb, len, current_text_addr());
  9. return tmp;
  10. }

这函数其实就是从tailroom预留空间,相当于是移动tail指针,这样如果从上图(图六)开始看,也就是tail开始向下移动,和data分离了。。。一般来说,这样做都是为了用户数据再次处理,或者说为TCP/IP的负载预留空间!

看图七,当使用skb_put时候,由图六---->图七

     (图七)

我们可以看到指针的移动data还是在headroom的下面,中间的是用户数据预留的部分,由skb_put得到,tail表示数据结尾!再看一下sk_buff中的len,变成了数据长度ld!!

> : skb_push函数:----------> 用于操作headroom区域的协议头

  1. static inline unsigned char *skb_push(struct sk_buff *skb, unsigned int len)
  2. {
  3. skb->data -= len;      // 向上移动指针
  4. skb->len  += len;      // 数据长度增加
  5. if (unlikely(skb->data<skb->head))  // data指针超过head那么就是处理错误~
  6. skb_under_panic(skb, len, current_text_addr());
  7. return skb->data;
  8. }

和skb_put对应,上面试操作用户数据的,这里是操作协议头的!其实就是data指针向上移动而已~注意len增大了哦~前面说了协议头也是属于数据!

如下面图所示,由图七---->图八

   (图八)

我们可以知道,data向上移动了,同时注意len变成ld+lp了,其中lp是这个增加的协议头的长度!

> : skb_pull函数:-----------> 其实这个函数才是与skb_push函数对应的函数!因为这是去头函数,而skb_push是增头函数!所以这个函数一般用在解包的时候!

  1. static inline unsigned char *skb_pull(struct sk_buff *skb, unsigned int len)
  2. {
  3. return unlikely(len > skb->len) ? NULL : __skb_pull(skb, len);
  4. }
  5. static inline unsigned char *__pskb_pull(struct sk_buff *skb, unsigned int len)
  6. {
  7. if (len > skb_headlen(skb) &&
  8. !__pskb_pull_tail(skb, len-skb_headlen(skb)))
  9. return NULL;
  10. skb->len -= len;                              // 长度减小
  11. return skb->data += len;                      // 移动指针
  12. }

其实就是data指针向下移动,当前一个协议头被去掉,headroom剩余的空间增大了!看下图:

由图八---->图九:

 (图九)

虚线是data之前的指针位置,现在移动到下面实线!!需注意:len的长度减小,减小的大小是剥去的头的大小!!

四、

最后我们从两条线整体分析一下:

1:从应用层用户数据开始,直到物理层发送出去

> 初始化的什么就不多说了,和前面的差不多,现在也加入用户数据已经在了,如图七所示一样!那么到了TCP层,需要增加

TCP层的头:

如图10所示:

         (图10)

需要注意的是这里是传输层,那么传输层的结构u中的th代表的是tcp的头,那么tcp指向tcp头OK!同时注意 len长度+=l1 哦~~~

> 再看到了IP层:如图11

 (图11)

至于需要解释什么就没什么了,都是一样的~

> 到链路层了:如图12

  (图12)

OK!

2:第二个过程其实是第一个逆过程,都差不多,所以不多说了~

五、

最后看一下操作skb的两个函数pskb_copy和skb_copy

前者仅仅是将sk_buff的结构体和线性数据copy过来,对于非线性数据,是引用原始的skb的数据的!而后者是不仅将sk_buff和线性数据拷贝,同时将非线性数据也copy了一份,看下面就明白了!这就在效率上就差了很多!所以如果不想修改数据,那么还是使用pskb_copy更好!

对于pskb_copy:

对于skb_copy:

OK  我觉得差不多了~~~~~结束~~~~~~~~~~~~~

skbuff的更多相关文章

  1. Linux Kernel ‘skbuff.c’本地拒绝服务漏洞

    漏洞名称: Linux Kernel ‘skbuff.c’本地拒绝服务漏洞 CNNVD编号: CNNVD-201307-498 发布时间: 2013-07-24 更新时间: 2013-07-24 危害 ...

  2. Linux skbuff注释笔记

    SKB结构定义   /usr/src/linux/include/linux/skbuff.h sk_buff_head: struct sk_buff_head { //SKB的头结点 /* The ...

  3. Difference between skbuff frags and frag_list

    skb_shinfo(head)->frag_list skb_shinfo(head)->frags[]能区分开来吗???结论就是: frags[] are for scatter-ga ...

  4. Linux网络驱动--snull

    snull是<Linux Device Drivers>中的一个网络驱动的例子.这里引用这个例子学习Linux网络驱动. 因为snull的源码,网上已经更新到适合最新内核,而我自己用的还是 ...

  5. 嵌入式Linux驱动学习之路(二十六)DM9000C网卡驱动程序

    基于DM9000C的原厂代码修改dm9000c的驱动程序. 首先确认内存的基地址 iobase. 确定中断号码. 打开模块的初始化函数定义. 配置内存控制器的相应时序(结合DM9000C.C的手册). ...

  6. 嵌入式Linux驱动学习之路(二十五)虚拟网卡驱动程序

    一.协议栈层次对比 设备无关层到驱动层的体系结构 1).网络协议接口层向网络层协议提供提供统一的数据包收发接口,不论上层协议为ARP还是IP,都通过dev_queue_xmit()函数发送数据,并通过 ...

  7. python网络编程-socket编程

     一.服务端和客户端 BS架构 (腾讯通软件:server+client) CS架构 (web网站) C/S架构与socket的关系: 我们学习socket就是为了完成C/S架构的开发 二.OSI七层 ...

  8. python网络编程

    Socket是网络编程的一个抽象的概念. 通常我们用一个Socket表示"打开了一个网络链接",而打开一个Socket需要知道目标计算机的IP地址和端口号,再指定协议类型即可. 套 ...

  9. Python之路【第七篇】python基础 之socket网络编程

    本篇文章大部分借鉴 http://www.cnblogs.com/nulige/p/6235531.html python socket  网络编程 一.服务端和客户端 BS架构 (腾讯通软件:ser ...

随机推荐

  1. SpringBoot的启动配置原理

    一.启动流程 创建SpringApplication对象 public class SpringApplication { public SpringApplication(Class... prim ...

  2. 调用打码平台api获取验证码 (C#版)

    一.打码平台很多,这里选择两个:联众和斐斐 联众开发文档: https://www.jsdati.com/docs/guide 斐斐开发文档: http://docs.fateadm.com/web/ ...

  3. js 中, set 与 数组 相互转换

    主要用 Array.from 方法 1.array --> set (数组转set) let array = [1, 2, 3, 4]; let set = new Set(array); 2. ...

  4. VIM从原理上认识^M问题

    问题背景 VIM在打开文件的时候如果遇到两种换行符风格(dos与unix)共存的文件,通常会在行尾显示出烦人的^M.如果^M较少,比较容易定位到哪几行出了问题,但是如果^M较多,就很难搞.下面先给出解 ...

  5. element之table自定义表头

    1.实现效果 2.使用render-header可以自定义表头 <el-table-column prop="date" label="日期" sorta ...

  6. JS__POST

    RSA加密 熟悉的东西 public key Encrypt (函数) 而且 每次刷新都会变化() 一般 128 位,也有 256位的

  7. linux 下安装 jdk1.7

    1.官网 下载jdk7版本 地址: http://www.oracle.com/technetwork/java/javase/downloads/java-archive-downloads-jav ...

  8. 【异常】ERROR main:com.cloudera.enterprise.dbutil.SqlFileRunner: Exception while executing ddl scripts. com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: Table 'ROLES' already exists

    1 详细异常 2019-10-11 10:33:55,865 INFO main:com.cloudera.server.cmf.Main: ============================= ...

  9. Django模型层:单表操作,多表操作,常用(非常用)字段和参数,Django-model进阶

    一.web应用 二.模板的导入与继承 三.静态文件相关 四.inclusion_tag:返回html片段 五.模型层 一.web应用 -s包括两个部分:web服务器+application -目前阶段 ...

  10. IIS教程:因权限问题被拒绝访问的解决方案

    https://blog.csdn.net/a497785609/article/details/49952281 写了一个类IISAdmin,负责建立.设置.删除虚拟目录,发现在web中调用,遇到权 ...