不知道原帖,我是从这里看到了,解决了迷惑我很久的疑问,抄过来。

看见noble_shi兄弟"关于net_rx_action函数的若干问题"贴中关于pt_prev的问题, 本来想在论坛上找到一个相关的帖子的链接告诉他。但是发现咱们论坛上关于pt_prev的讨论要么没有说明,要么理解的偏差,甚至是错误。而且关于pt_prev的提问很多。故写了以下内容。



    不过本人水平有限,难免说错。请执教getmoon@163.com



    结论:pt_prev使用的原因是为了减少一次kfree_skb的调用,提高效率。



    如果有异议的请往下看。如果你对skb非常了解,那么请直接看<三>, 否则请一步一步往下看。



<一>相关知识

在讲pt_prev的作用之前, 咱们先说明以下的东西。

(1)alloc_skb中初始化skb->users计数为1。

struct sk_buff( )
{
....
atomic_set(&skb->users, 1);
...
}

(2)kfree_skb中如果计数skb->users不为1则不会释放skbuff 。

static inline void kfree_skb(struct sk_buff *skb)
{
if (atomic_read(&skb->users) == 1 || atomic_dec_and_test(&skb->users))
__kfree_skb(skb);
}

当引用数为1或者引用数减1等于零时, 回收包缓冲。



(3)linux内核网络协议栈中到本机的skb包是在上层协议中释放的。



<二>实现ptype_base和ptype_all链


    讲了上面的东西后咱们来看ptype_base及ptype_all链相关的东西。这两个链的作用在这里就不讲了。 因为有了上面的东西,
所以涉及到一个skbuff共享的问题, 如果都用skb_clone或者skb_copy,那么性能将是很低的。
所以在linux中使用了skb共享的计数,就是用skb->users计数来计算共享的地方。

许多人理解了ptype_all和ptype_base链的作用之后,就认为为什么不用下面的算法实现。

for (ptype=ptype_base[ntohs(type)&15];ptype;ptype=ptype->next) {
if (ptype->type == type && (!ptype->dev || ptype->dev == skb->dev)) {
atomic_inc(&skb->users);
ptype->func(skb, skb->dev, ptype);
}
}
kfree_skb(skb);

我来说说为什么最后还要一个kfree_skb。在进入这个for循环之前,skb->users的计数为1,每进入一个ptype->fun函数之前都会加,并且在每个ptype->fun函数里面都会有kfree_skb函数(会减users),但是并没有真正的把skb释放掉。还记得刚开始说明中kfree_skb里面的atomic_dec_and_test(&skb->users)吗。 所以atomic_inc(&skb->users);ptype->func(skb, skb->dev, ptype);两句代码执行之后并没有改变skb->users的计数,还是1。所以这样可以在for循环中循环好几次, 无论几个ptype->func都可以共享这个skb。退出for循环之后, skb->users还是1,并且之前并没有真正的释放掉内存。因此你要调用kfree_skb(skb) 来释放内存。

   
再说明一下另外一个问题,如果for循环就调用了ptype->func函数一次的话,那么在整个包的流程中,是调用了kfree_skb两次。
一次在ptype->func函数中,第二次是在for循环之后, 就是上面代码中的kfree_skb 。

说了上面的这个例子之后, 如果你现在知道了为什么用pt_prev来提交效率,那么你就不用往下看了。



<三> 利用pt_prev来提高效率


    理解了上面的内容之后,咱们来看看2.4中的代码。

for (ptype=ptype_base[ntohs(type)&15];ptype;ptype=ptype->next) {
if (ptype->type == type && (!ptype->dev || ptype->dev == skb->dev)) {
if (pt_prev) {
if (!pt_prev->data)
deliver_to_old_ones(pt_prev, skb, 0);
else {
/*到这里,那么pt_prev指针不为空,ptype(当前的)不为空,那么肯定要共享一次了,所以加1*/
atomic_inc(&skb->users);
pt_prev->func(skb,skb->dev, pt_prev);
/*执行上面的函数之后,会在里面减1。所以相对来说,上面两句代码执行之后并没有对skb->users的值进行影响。*/
}
}
pt_prev = ptype;
}
} /*现在skb->users的计数还是为1*/
if (pt_prev) {
if (!pt_prev->data)
deliver_to_old_ones(pt_prev, skb, 1);
else
/*在这里就没有用atomic_inc(&skb->users);因为到这里,skb->users就为1,并且这里是最后一次,所以不用加1,
那么skb就直接在下面的pt_prev->func(skb, skb->dev, pt_prev);函数中释放了。
*/
pt_prev->func(skb, skb->dev, pt_prev);
} else{
/*到这里,已经没有对skb进行操作的了。所以必须调用kfree_skb把skb释放掉。*/
kfree_skb(skb);
}

你看,<二>和<三>相比是否少了一次调用kfree_skb呢。



    到现在, 你是否理解了为什么么用pt_prev了。

    你是否在为那些家伙的高深之处而感慨那。

    anything i can help u , please email to : getmoon@163.com



后续讨论

ID:rainfall

   
今天我仔细看了一下linux2.2.x的net_bh,我认为pt_prev的作用是减少一次skb_clone(当然也少一次kfree_skb)。得出这个结论的理由是:每次在处理skbuff时,相关的处理都会复制一次skbuff的头。如果链表上有n个元素,就要复制n次,然后还有释放n次。最后还要释放结构本身。但是如果只复制n-1次,最后处理的就是数据本身(引用计数为1)。这样会少复制一次。不过getmoon的说法也没错,只是我觉得从复制的角度看,可能更能体现


出高效的主题。毕竟,释放并不花什么时间。

ID:getmoon

    实际上是这样的,2.2的net_bh里面也采用了这个pt_prev。 它的功能还是如我所言。

兄弟看见的是在调用每个pt->func之前clone了一个。 实际上这个clone在2.4里面并没有去掉。 只是把它移动每个具体的pt->funct里面。 你可以看arp_rcv , ip_rcv等函数都有一个

    if ((skb = skb_share_check(skb, GFP_ATOMIC)) == NULL)
goto out_of_mem;

这个函数实际上也是clone一个。而2.2的每个pt->func如arp_rcv , ip_rcv里面都是没有的。
因为在调用pt->func之前就clone了。所以2.4的做法是实际上把skb_clone往后移动了。
为什么呢。我想这个还是重效率上考虑的。

    我想作者的想法是:如果在pt->func函数里面根本没有必要skb_clone一下, 我为什么

在硬给它clone一个呢。如果呢需要新的skb头,那么呢自己clone去。 因为可能有的人不需要。

关于ptype_all和pypte_base中的pt_prev的说明[转]的更多相关文章

  1. ptype_base和ptype_all学习笔记

    "linux-2.6.32/include/linux/netdevice.h" struct packet_type { __be16 type; /* This is real ...

  2. 一文彻底搞通TCP之send & recv原理

    接触过网络开发的人,大抵都知道,上层应用使用send函数发送数据,使用recv来接收数据,而send和recv的实现原理又是怎样的呢? 在前面的几篇文章中,我们有提过,TCP是个可靠的.全双工协议.其 ...

  3. Python开源框架

    info:更多Django信息url:https://www.oschina.net/p/djangodetail: Django 是 Python 编程语言驱动的一个开源模型-视图-控制器(MVC) ...

  4. Linux内核中流量控制

    linux内核中提供了流量控制的相关处理功能,相关代码在net/sched目录下:而应用层上的控制是通过iproute2软件包中的tc来实现, tc和sched的关系就好象iptables和netfi ...

  5. Alan Cox:单向链表中prev指针的妙用

    之前发过一篇二级指针操作单向链表的例子,显示了C语言指针的灵活性,这次再探讨一个指针操作链表的例子,而且是一种完全不同的用法. 这个例子是linux-1.2.13网络协议栈里的,关于链表遍历& ...

  6. ip_rcv 中使用skb_share_check

    /* * Main IP Receive routine. */ int ip_rcv(struct sk_buff *skb, struct net_device *dev, struct pack ...

  7. TCP/IP协议栈在Linux内核中的运行时序分析

    网络程序设计调研报告 TCP/IP协议栈在Linux内核中的运行时序分析 姓名:柴浩宇 学号:SA20225105 班级:软设1班 2021年1月 调研要求 在深入理解Linux内核任务调度(中断处理 ...

  8. mapreduce中一个map多个输入路径

    package duogemap; import java.io.IOException; import java.util.ArrayList; import java.util.List; imp ...

  9. Hadoop 中利用 mapreduce 读写 mysql 数据

    Hadoop 中利用 mapreduce 读写 mysql 数据   有时候我们在项目中会遇到输入结果集很大,但是输出结果很小,比如一些 pv.uv 数据,然后为了实时查询的需求,或者一些 OLAP ...

随机推荐

  1. 小程序mpvue中flyio的使用方法

    Fly.js 一个基于Promise的.强大的.支持多种JavaScript运行时的http请求库. 有了它,您可以使用一份http请求代码在浏览器.微信小程序.Weex.Node.React Nat ...

  2. 原生 Java 客户端进行消息通信

    原生 Java 客户端进行消息通信 Direct 交换器 DirectProducer:direct类型交换器的生产者 NormalConsumer:普通的消费者 MulitBindConsumer: ...

  3. Linux:配置apache支持php

    对apache的主配置文件进行修改 vi /application/apache/conf/httpd.conf 1.增加下面内容 AddType application/x-httpd-php .p ...

  4. Win10 在VM里面装Centos7.4后使用桥接模式连接外网,并用MobaXterm远程虚拟机详细教程

    1.首先登陆虚拟机如图 2.执行ping命令看虚拟机里面的centos7是否可以连网 ping www.baiducom 此时会报错:name or service not known 3.设置一个文 ...

  5. Css3新增的特性(1)

    CSS3 模块 CSS3被拆分为"模块".旧规范已拆分成小块,还增加了新的. 一些最重要CSS3模块如下: 选择器 盒模型 背景和边框 文字特效 2D/3D转换 动画 多列布局 用 ...

  6. Matrix Power Series(POJ 3233)

    原题如下: Matrix Power Series Time Limit: 3000MS   Memory Limit: 131072K Total Submissions: 28044   Acce ...

  7. 3.CDN加速简介

    什么是CDN CDN的全称是Content Delivery Network,即内容分发网络.CDN的基本原理是广泛采用各种缓存服务器,将这些缓存服务器分布到用户访问相对集中的地区或网络中,在用户访问 ...

  8. 抓取 USB 总线LOG

    在实际工作中经常会遇到需要分析USB报文的情形.比如对比不同厂家4G/5G模块.解决实际IP over USB传输效率低下问题. 这时候如果能抓取到 USBMOM 总线的报文将会大有裨益.毕竟所有ho ...

  9. JavaScript闭包函数的理解

    闭包就是一个函数能够访问其函数外部作用域中的变量,即在外面可以调用函数中的函数的变量,其实他就是将函数内外部连接起来的桥梁 闭包三大特点: 1. 函数嵌套函数 2. 内部函数可以访问外部函数的变量 3 ...

  10. MySql基础_DDL_DML_DQL(资料一)

    今日内容 数据库的基本概念 MySQL数据库软件 安装 卸载 配置 SQL 数据库的基本概念 1. 数据库的英文单词: DataBase 简称 : DB 2. 什么数据库? * 用于存储和管理数据的仓 ...