网络软中断与NAPI函数分析
网卡只有rx硬中断,外设通过中断控制器向CPU发出有数据包来临的通知,
而没有tx硬中断,因为发送数据包是cpu向外设发出的命令。
ixgbe驱动的rx软中断和tx软中断在同一个CPU上处理。
http://abcdxyzk.github.io/blog/2014/12/16/kernel-net-softirq-rx/
static void net_rx_action(struct softirq_action *h)
{
/*取得本地cpu 的softnet_data 的poll_list 链表*/
struct list_head *list = &__get_cpu_var(softnet_data).poll_list;
/*设置软中断处理程序一次允许的最大执行时间为2个jiffies*/
unsigned long time_limit = jiffies + ; /*设置软中断接收函数一次最多处理的报文个数为 300 */
int budget = netdev_budget;
/*关闭本地cpu的中断,下面判断list是否为空时防止硬中断抢占*/
local_irq_disable();
/*循环处理pool_list 链表上的等待处理的napi*/
while (!list_empty(list))
{
struct napi_struct *n;
int work, weight; /*如果处理报文超出一次处理最大的个数
或允许时间超过最大时间就停止执行,
跳到softnet_break 处*/
if (unlikely(budget <= || time_after(jiffies, time_limit)))
{
goto softnet_break;
}
/*使能本地中断,上面判断list为空已完成,下面调用NAPI的
轮询函数是在硬中断开启的情况下执行*/
local_irq_enable(); /* 取得softnet_data pool_list 链表上的一个napi,
即使现在硬中断抢占软中断,会把一个napi挂到pool_list的尾端
软中断只会从pool_list 头部移除一个pool_list,这样不存在临界区*/
n = list_entry(list->next, struct napi_struct, poll_list);
/*用weighe 记录napi 一次轮询允许处理的最大报文数*/
weight = n->weight;
/* work 记录一个napi总共处理的报文数*/
work = ; /*如果取得的napi状态是被调度的,就执行napi的轮询处理函数*/
if (test_bit(NAPI_STATE_SCHED, &n->state))
{
work = n->poll(n, weight);
}
WARN_ON_ONCE(work > weight);
/*预算减去已经处理的报文数*/
budget -= work;
/*禁止本地CPU 的中断,下面会有把没执行完的NAPI挂到softnet_data
尾部的操作,和硬中断存在临界区。同时while循环时判断list是否
为空时也要禁止硬中断抢占*/
local_irq_disable(); /*如果napi 一次轮询处理的报文数正好等于允许处理的最大数,
说明一次轮询没处理完全部需要处理的报文*/
if (unlikely(work == weight))
{
/*如果napi已经被禁用,就把napi 从 softnet_data 的pool_list 上移除*/
if (unlikely(napi_disable_pending(n)))
{
local_irq_enable();
napi_complete(n);
local_irq_disable();
}
else
{
/*否则,把napi 移到 pool_list 的尾端*/
list_move_tail(&n->poll_list, list);
}
}
}
out:
local_irq_enable();
return; /*如果处理时间超时,或处理的报文数到了最多允许处理的个数,
说明还有napi 上有报文需要处理,调度软中断。
否则,说明这次软中断处理完全部的napi上的需要处理的报文,不再需要
调度软中断了*/
softnet_break:
__get_cpu_var(netdev_rx_stat).time_squeeze++;
__raise_softirq_irqoff(NET_RX_SOFTIRQ);
goto out;
}
static int process_backlog(struct napi_struct *napi, int quota)
{
int work = ; /*取得本地CPU上的softnet_data 数据*/
struct softnet_data *queue = &__get_cpu_var(softnet_data); /*开始计时,一旦允许时间到,就退出轮询*/
unsigned long start_time = jiffies;
napi->weight = weight_p; /*循环从softnet_data 的输入队列取报文并处理,直到队列中没有报文了,
或处理的报文数大于了允许的上限值了,
或轮询函数执行时间大于一个jiffies 了
*/
do
{
struct sk_buff *skb;
/*禁用本地中断,要存队列中取skb,防止抢占*/
local_irq_disable(); /*从softnet_data 的输入队列中取得一个skb*/
skb = __skb_dequeue(&queue->input_pkt_queue); /*如果队列中没有skb,则使能中断并退出轮询*/
if (!skb)
{
/*把napi 从 softnet_data 的 pool_list 链表上摘除*/
__napi_complete(napi);
/*使能本地CPU的中断*/
local_irq_enable();
break;
}
/*skb 已经摘下来了,使能中断*/
local_irq_enable(); /*把skb送到协议栈相关协议模块进行处理,详细处理见后续章节*/
netif_receive_skb(skb);
} while (++work < quota && jiffies == start_time);
/*返回处理报文个数*/
return work;
}
int netif_rx(struct sk_buff *skb)
{
struct softnet_data *queue;
unsigned long flags; /*如果接收skb的时间戳没设定,设定接收时间戳*/
if (!skb->tstamp.tv64)
{
net_timestamp(skb);
} /*禁止本地cpu的中断*/
local_irq_save(flags); /*取得本地cpu的softnet_data*/
queue = &__get_cpu_var(softnet_data); /*每个CPU都有一个统计数据,增加统计数据*/
__get_cpu_var(netdev_rx_stat).total++; /*如果本地CPU的输入队列中的skb 个数小于允许的最多的个数*/
if (queue->input_pkt_queue.qlen <= netdev_max_backlog)
{
/*如果本地cpu的输入队列长度不为0,表示输入队列已经有skb了,
并且特殊的napi backlog 已经挂入了softnet_data 的
pool_list上了*/
if (queue->input_pkt_queue.qlen)
{
enqueue:
/*把skb 放入CPU的输入队列 input_pkt_queue*/
__skb_queue_tail(&queue->input_pkt_queue, skb); /*使能中断 并 返回*/
local_irq_restore(flags);
return NET_RX_SUCCESS;
}
/*如果输入队列为空,则把 特殊的napi backlog 挂到softnet_data
的 pool_list 上 并返回把skb放入输入队列并返回*/
napi_schedule(&queue->backlog);
goto enqueue;
}
/*如果本地cpu的输入队列已经满了,则丢弃报文,
并增加丢包计数并返回*/
__get_cpu_var(netdev_rx_stat).dropped++;
local_irq_restore(flags); kfree_skb(skb);
return NET_RX_DROP;
}
/* 如果NAPI程序正在运行,则啥也不干,直接返回。
* 反之,如果NAPI程序不在运行,则调用__napi_schedule()
* 将设备的napi_struct添加到轮询表中,并引发
* 软中断NET_RX_SOFTIRQ。
* 这通知内核在net_rx_action()中开始轮询。
*/
//同一时刻只允许有一个NAPI poll
static inline void napi_schedule(struct napi_struct *n)
{
if (napi_schedule_prep(n))
__napi_schedule(n);
} /**
* napi_schedule_prep - check if napi can be scheduled
* @n: napi context
* Test if NAPI routine is already running, and if not mark it as running.
* This is used as a condition variable insure only one NAPI poll instance runs.
* We also make sure there is no pending NAPI disable.
*/
//检查napi是否可以被调度
static inline int napi_schedule_prep(struct napi_struct *n)
{
return !napi_disable_pending(n) && !test_and_set_bit(NAPI_STATE_SCHED, &n->state);
} //检查NAPI_STATE_DISABLE是否置位
static inline int napi_disable_pending(struct napi_struct *n)
{
return test_bit(NAPI_STATE_DISABLE, &n->state);
} enum {
NAPI_STATE_SCHED, /* Poll is scheduled */
NAPI_STATE_DISABLE, /* Disable pending */
NAPI_STATE_NPSVC, /* Netpoll - don't dequeue from poll_list */
}; void __napi_schedule(struct napi_struct *n)
{
unsigned long flags;
local_irq_save(flags);
____napi_schedule(&__get_cpu_var(softnet_data), n);
local_irq_restore(flags);
} static inline void ____napi_schedule(struct softnet_data *sd, struct napi_struct *napi)
{
/* 把napi_struct添加到softnet_data的poll_list中 */
list_add_tail(&napi->poll_list, &sd->poll_list);
__raise_softirq_irqoff(NET_RX_SOFTIRQ); /* 设置软中断标志位 */
}
网络软中断与NAPI函数分析的更多相关文章
- start_amboot()函数分析
一.整体流程 start_amboot()函数是执行完start.S汇编文件后第一个C语言函数,完成的功能自然还是初始化的工作 . 1.全局变量指针r8设定,以及全局变量区清零 2.执行一些类初始化函 ...
- NS2仿真:两个移动节点网络连接及协议性能分析
NS2仿真实验报告2 实验名称:两个移动节点网络连接及协议性能分析 实验日期:2015年3月9日~2015年3月14日 实验报告日期:2015年3月15日 一.实验环境(网络平台,操作系统,网络拓扑图 ...
- LwIP协议栈开发嵌入式网络的三种方法分析
LwIP协议栈开发嵌入式网络的三种方法分析 摘要 轻量级的TCP/IP协议栈LwIP,提供了三种应用程序设计方法,且很容易被移植到多任务的操作系统中.本文结合μC/OS-II这一实时操作系统,以 ...
- 抓住“新代码”的影子 —— 基于GoAhead系列网络摄像头多个漏洞分析
PDF 版本下载:抓住“新代码”的影子 —— 基于GoAhead系列网络摄像头多个漏洞分析 Author:知道创宇404实验室 Date:2017/03/19 一.漏洞背景 GoAhead作为世界上最 ...
- split(),preg_split()与explode()函数分析与介
split(),preg_split()与explode()函数分析与介 发布时间:2013-06-01 18:32:45 来源:尔玉毕业设计 评论:0 点击:965 split()函数可以实 ...
- string函数分析
string函数分析string函数包含在string.c文件中,经常被C文件使用.1. strcpy函数原型: char* strcpy(char* str1,char* str2);函数功能: 把 ...
- uboot的jumptable_init函数分析
一.函数说明 函数功能:安装系统函数指针 函数位置:common/exports.c 二.函数分析 void jumptable_init (void) { int i; gd->jt = (v ...
- Linux-0.11内核源代码分析系列:内存管理get_free_page()函数分析
Linux-0.11内存管理模块是源码中比較难以理解的部分,如今把笔者个人的理解发表 先发Linux-0.11内核内存管理get_free_page()函数分析 有时间再写其它函数或者文件的:) /* ...
- UNIX网络编程——epoll 系列函数简介、与select、poll 的区别
前面博客<<UNIX环境高级编程--epoll函数使用详解>>有关于epoll函数的讲解. 一.epoll 系列函数简介 #include <sys/epoll.h> ...
随机推荐
- 解决Xshell中使用hbase shell backspace无法删除
进入到XShell 文件 –> 属性 –> 终端 –> 键盘 在 DELETE键序列 和 BACKSPACE键序列 中都选择 ASCII 127 最后进入 Hbase 命令行测试,可 ...
- 前端框架之SweetAlert
简介 SweetAlert是一款很好用的弹出框框架 下载 点我下载 导入 博主用的是bootstrap-sweetalert,所以要依赖bootstrap,导入前先导入原生jQuery以及bootst ...
- Python 有什么奇技淫巧?
知乎上有一个问题:Python 有什么奇技淫巧?其中有各种不按套路出牌的招数,也不乏一些惊为天人的"奇技淫巧",会让你大呼:居然还有这种操作??? 本文就是对日常使用过的或者觉得很 ...
- 【我的Android进阶之旅】推荐一款视频转换GIF图片格式的转换工具(Video to GIF)
一.背景 最近想把一些Android Demo的运行效果图获取下来,但是一直使用真机进行调试,在电脑上不好截取一段gif动画.而之前使用模拟器的时候可以使用 GifCam 工具进行屏幕动画截取.Gif ...
- leetcode第一刷_Simplify Path
这道题的思路还是比較清晰的,用栈嘛,麻烦是麻烦在这些层次的细节上.主要有以下几个: ./和/:当前路径,遇到这样的,应该将后面的文件夹或文件入栈. ../:上一层路径.遇到这样的.应该做一次出栈操作, ...
- nginx映射文件服务器文件夹
nginx映射文件服务器文件夹 普通用户A安装的nginx,yum源搭建文件服务器,新建普通用户B,其主目录是文件服务器需要访问的目录 普通用户A启动nginx无法访问B用户的文件服务器目录,提示40 ...
- #运算符、不同的指针类型、数组和指针、指针运算、堆、栈、静态区、只读区、下标VS指针
#运算符:用于在预编译期将宏参数转换为字符串 #define CONVERS(x) #x //注:没用双引号包括. 不同类型的指针占用的内存空间大小相同. 局部变量 定义: a[5]; 打印a[ ...
- C的指针疑惑:C和指针13(高级指针话题)
传递命令行参数 C程序的main函数具有两个形参.第一个通常称为argc,代表命令行参数的数目. 第二个通常称为argv,它指向一组参数值.由于参数的数目并没有内在的限制,所以argv指向这组参数值( ...
- VirtualBox AndroidX86 网络设置
在Virtualbox中,把虚拟机网络设为“网络地址转换(NAT)”模式,高级中控制芯片(T)选择:PCnet-FAST III(Am79C973), 然后启动你的android-x86 4.0虚拟机 ...
- 150. Evaluate Reverse Polish Notation(逆波兰表达式)
Evaluate the value of an arithmetic expression in Reverse Polish Notation. Valid operators are +, -, ...