linux-2.6.38poll机制简析(以tiny6410按键中断程序为基础)
一、应用程序
/*
struct pollfd {
int fd; //文件描述符
short events; //表示请求检测的事件
short revents; //表示检测之后返回的事件
};
*/
int fd;
struct pollfd fds[]; // 只用poll函数来检测一个描述符
fd = open("/dev/tiny6410_button", );
fds[].fd = fd; //存放文件描述符
fds[].events = POLLIN; //有数据可以读
while ()
{
ret = poll(fds, , ); // int poll(struct pollfd fds[], nfds_t nfds, int timeout)
if (ret == ) // fds[]:存放需要被检测状态的描述符 nfds:fds[]数组的个数 timeout:poll函数阻塞调用的时间
{
printf("timeout fds[0].revents = %d \n",fds[].revents);
}
else if (ret>)
{
printf("fds[0].revents = %d\n",fds[].revents);
read(fd, press_cnt, sizeof(press_cnt));
for (i = ; i < sizeof(press_cnt)/sizeof(press_cnt[]); i++)
{
if (press_cnt[i])
printf("K%d has been pressed %d times!\n", i+, press_cnt[i]);
}
}
else
{
return ;
}
}
close(fd);
return ;
poll(...)函数的返回值:>0 表示 fds[]中存放的某些文件描述符的状态发生了变化
=0 表示 fds[]中存放的文件描述符的状态没有变化,并且调用超时了
<0 表示有错误发生
看到实验结果:当5秒没有按键按下时,timeout fds[0].revents = 0
当有按键立即按下时, fds[0].revents = 1
因此可以根据revents的值来判断哪个文件描述符的状态发生了变化
二、 从内核看poll 函数调用
2.1 找sys_poll(...)函数
在应用程序调用poll(...)函数时,内核会调用sys_poll(...)函数,因此在内核中寻找sys_poll(...)函数,在linux-2.6.38中,系统
调用函数名称都是用宏定义实现的。所有先找一找sys_poll(...)在哪里,在select.c中有如下函数:
SYSCALL_DEFINE3(poll, struct pollfd __user *, ufds, unsigned int, nfds, long, timeout_msecs)
这是一个宏定义,需要把这个宏定义展开成如下的形式:
asmlink long sys_poll( struct pollfd __user * ufds, unsigned int nfds, long timeout_msecs)
宏定义的展开过程分析:
在syscalls.h中有一大堆关于系统调用的宏定义
#define SYSCALL_DEFINE3(name, ...) SYSCALL_DEFINEx(3, _##name, __VA_ARGS__)
宏替换后变成了:
SYSCALL_DEFINEx(3, _poll, struct pollfd __user *, ufds, unsigned int, nfds, long, timeout_msecs)
#define SYSCALL_DEFINEx(x, sname, ...) __SYSCALL_DEFINEx(x, sname, __VA_ARGS__)
宏替换后变成了:
__SYSCALL_DEFINEx(3,_poll, struct pollfd __user *, ufds, unsigned int, nfds, long, timeout_msecs)
#define __SYSCALL_DEFINEx(x, name, ...) asmlinkage long sys##name(__SC_DECL##x(__VA_ARGS__))
宏替换后变成了:
asmlinkage long sys_poll(__SC_DECL3(struct pollfd __user *, ufds, unsigned int, nfds, long, timeout_msecs))
对__SC_DECL3(struct pollfd __user *, ufds, unsigned int, nfds, long, timeout_msecs)进行展开
__SC_DECL##x(__VA_ARGS__) 这个也是一个宏定义,仍然需要进行展开:
#define __SC_DECL1(t1, a1) t1 a1
#define __SC_DECL2(t2, a2, ...) t2 a2, __SC_DECL1(__VA_ARGS__)
#define __SC_DECL3(t3, a3, ...) t3 a3, __SC_DECL2(__VA_ARGS__)
#define __SC_DECL4(t4, a4, ...) t4 a4, __SC_DECL3(__VA_ARGS__)
#define __SC_DECL5(t5, a5, ...) t5 a5, __SC_DECL4(__VA_ARGS__)
#define __SC_DECL6(t6, a6, ...) t6 a6, __SC_DECL5(__VA_ARGS__)
就得到了 struct pollfd __user * ufds, unsigned int nfds, long timeout_msecs
故得到了最终的展开函数:
asmlink long sys_poll( struct pollfd __user * ufds, unsigned int nfds, long timeout_msecs)
2.2 函数调用过程分析
SYSCALL_DEFINE3(poll, struct pollfd __user *, ufds, unsigned int, nfds,
long, timeout_msecs)
{
....
//1.设置timeout时间
if (timeout_msecs >= ) {
to = &end_time;
poll_select_set_timeout(to, timeout_msecs / MSEC_PER_SEC,
NSEC_PER_MSEC * (timeout_msecs % MSEC_PER_SEC));
}
// 2.完成poll调用的主要任务
ret = do_sys_poll(ufds, nfds, to);
....
}
2.2.1这里的核心函数do_sys_poll(...)
int do_sys_poll(struct pollfd __user *ufds, unsigned int nfds,
struct timespec *end_time)
{
struct poll_wqueues table;
int err = -EFAULT, fdcount, len, size;
// 从这里开始都是分配内存空间,并将用户空间的fds[]拷贝到内核空间
long stack_pps[POLL_STACK_ALLOC/sizeof(long)];// 在栈上分配一个固定空间的
struct poll_list *const head = (struct poll_list *)stack_pps;//强制将上边分配的空间转换为poll_list
struct poll_list *walk = head;
unsigned long todo = nfds;//用户空间的fds[]数组的个数 if (nfds > rlimit(RLIMIT_NOFILE))
return -EINVAL; len = min_t(unsigned int, nfds, N_STACK_PPS);
for (;;) {
walk->next = NULL; //将指针先置为NULL
walk->len = len; //长度=len
if (!len)
break; if (copy_from_user(walk->entries, ufds + nfds-todo,
sizeof(struct pollfd) * walk->len))//拷贝的前提应该是不会超过分配内存的大小
goto out_fds; //当用户空间的fds[]超过所分配内存大小时,跳转 todo -= walk->len; //nfds-walk->len 求剩下多少个fds结构体组没有拷
if (!todo) //如果不剩即全部拷完了, 则break
break; len = min(todo, POLLFD_PER_PAGE); //若还剩todo个没考, 求下一次需要拷的个数
size = sizeof(struct poll_list) + sizeof(struct pollfd) * len;//求需要分配内存的大小
walk = walk->next = kmalloc(size, GFP_KERNEL);// 在分配size大小的内存,并将这块内存的首地址挂载walk->next上, 这样如果有很多fds[]的话,就可以够成一个一个的poll_list 链表, 链表之间通过poll_list->next 连接
if (!walk) {
err = -ENOMEM;
goto out_fds;
}
}
// 到这里已经分配完内存空间,并将所有的fds[]从用户空间拷贝到内核空间
poll_initwait(&table); // 这个函数就是初始化poll_wqueues类型的变量 table
初始化了什么,在下边分析
fdcount = do_poll(nfds, head, &table, end_time);// 核心函数
poll_freewait(&table); for (walk = head; walk; walk = walk->next) {
struct pollfd *fds = walk->entries;
int j; for (j = ; j < walk->len; j++, ufds++) // 分析到这里应该就很明朗了,这里是把revents从内核空间拷贝到用户空间,方便用户空间来查询哪些文件描述符的状态发生了变化
if (__put_user(fds[j].revents, &ufds->revents))
goto out_fds;
}
err = fdcount;
out_fds:
walk = head->next;
while (walk) {
struct poll_list *pos = walk;
walk = walk->next;
kfree(pos);
} return err;
}
在do_sys_poll(...)函数中,首先就是分配内存空间,将用户空间的fds[]拷贝到内核空间,具体的拷贝过程已经在注释中大概分析了
其次初始化table变量 ,在初始化table变量之前有必要看一下table是什么
struct poll_wqueues {
poll_table pt;
struct poll_table_page *table;
struct task_struct *polling_task;
int triggered;
int error;
int inline_index;
struct poll_table_entry inline_entries[N_INLINE_POLL_ENTRIES];
}; //这是table是什么 重点是poll_table成员 typedef struct poll_table_struct {
poll_queue_proc qproc;
unsigned long key;
} poll_table; // 这是poll_table 是什么
static void __pollwait(struct file *filp, wait_queue_head_t *wait_address,
poll_table *p)
{
struct poll_wqueues *pwq = container_of(p, struct poll_wqueues, pt);
struct poll_table_entry *entry = poll_get_entry(pwq);
if (!entry)
return;
get_file(filp);
entry->filp = filp;
entry->wait_address = wait_address;
entry->key = p->key;
init_waitqueue_func_entry(&entry->wait, pollwake);
entry->wait.private = pwq;
add_wait_queue(wait_address, &entry->wait);
}
void poll_initwait(struct poll_wqueues *pwq)
{
init_poll_funcptr(&pwq->pt, __pollwait); //见下边,这table->pt ->qproc = qproc = _pollwait;
pwq->polling_task = current;
pwq->triggered = ;
pwq->error = ;
pwq->table = NULL;
pwq->inline_index = ;
}
static inline void init_poll_funcptr(poll_table *pt, poll_queue_proc qproc)
{
pt->qproc = qproc;
pt->key = ~0UL; /* all events enabled */
}
上边的函数和结构体说明了初始化table变量的全过程
在初始化完成table之后: table->polling_task = current;
table->triggered = 0;
table->error = 0;
table->table = NULL;
table->inline_index = 0;
重点 table->pt->qproc = __pollwait; 这是给table->pt->qproc挂上了一个函数__pollwait,注意之后会用到,这个函数的具体类容已经在上边分析过了
2.2.2在do_sys_poll中核心函数: do_poll(nfds, head, &table, end_time);
for (;;) { //这里三层循环嵌套,虽然复杂,但是就是遍历从用户空间拷贝的fds[]数组,然后执行do_pollfd(pfd,pt) ,这里的pt就是上边分析的wait->pt
struct poll_list *walk; for (walk = list; walk != NULL; walk = walk->next) {
struct pollfd * pfd, * pfd_end; pfd = walk->entries;
pfd_end = pfd + walk->len;
for (; pfd != pfd_end; pfd++) {
if (do_pollfd(pfd, pt)) {
count++;
pt = NULL;
}
}
}
pt = NULL;
if (!count) {
count = wait->error;
if (signal_pending(current))
count = -EINTR;
}
if (count || timed_out)
break;
if (end_time && !to) {
expire = timespec_to_ktime(*end_time);
to = &expire;
} if (!poll_schedule_timeout(wait, TASK_INTERRUPTIBLE, to, slack))
timed_out = ;
}
(1)发循环退出条件的分析:
第一个条件:fds[]文件中某些文件描述符的状态发生了变化,即fd[x]->revents != 0
第二个条件:timeout != 0 也就是超时了
这里先分析第二个条件即timeout != 0的情况
当timeout != 0时大循环退出 注意在这里边timeout看起来像是一个bool量,程序刚进入do_poll(...)时,timeout为0, 假设所有的文件描述符的状态都没有发生变化, 然后执行休眠函数poll_schedule_timeout(wait, TASK_INTERRUPTIBLE, to, slack)后,定时休眠成功后timeout变成1,然后再次循环,此时不管fds[]中文件描述符的状态怎么样,timeout都为1,都会退出大循环。
(2) 第一个退出条件分析:count != 0时
static inline unsigned int do_pollfd(struct pollfd *pollfd, poll_table *pwait)
{
// 先看传入参数:pollfd :fds[]数组中的某一个注意是拷贝到内核空间的fds[]
// pwait : 这个pwait就是之前初始化的table->pt
// pt下边挂着一个回调函数,在这里派上用处了
unsigned int mask;
int fd; mask = ;
fd = pollfd->fd; // 取出文件描述符
if (fd >= ) {
int fput_needed;
struct file * file; file = fget_light(fd, &fput_needed);
mask = POLLNVAL;
if (file != NULL) {
mask = DEFAULT_POLLMASK;
if (file->f_op && file->f_op->poll) { // 这里就和文件操作对应的结构体中中的内容就比较相似了,
//当我们驱动程序中定义了文件操作结构体,并且定义了poll函数,那么久执行驱动程序的poll函数
if (pwait)
pwait->key = pollfd->events |
POLLERR | POLLHUP;
mask = file->f_op->poll(file, pwait); // 这里执行驱动程序的poll函数, 传入参数有一个回调函数
//这个回调函数就是之前初始化table提到的
// 注意驱动程序poll函数执行完会返回一个值, 正是根据驱动程序中的poll函数的返回值来确定,我们的文件描述符的状态是否发生了变化
}
/* Mask out unneeded events. */
mask &= pollfd->events | POLLERR | POLLHUP;
fput_light(file, fput_needed);
}
}
pollfd->revents = mask; return mask;
}
这里的do_pollfd(...)函数实际上就是执行驱动函数poll,通过驱动函数来判断文件描述符的状态。
这里我们结合按键驱动的poll函数来分析这个是怎么判断状态的
unsigned int tiny6410_button_poll (struct file *file, struct poll_table_struct *wait)
{
unsigned int mask = ;
poll_wait(file, &button_waitq, wait);
if (ev_press)
mask |= POLLIN;
return mask;
}
(1)驱动函数中的poll_wait(file, &button_waitq, wait) , 注意wait是table->pt
poll_wait(file, &button_waitq, wait) ====》table->pt->qproc(file, &button_waitq, table->pt) ===》__pollwait(file,&button_waitq,table->pt)
这个_pollwait(.....)函数之前提过,现在在重复一遍:
static void __pollwait(struct file *filp, wait_queue_head_t *wait_address,
poll_table *p)
{
...
add_wait_queue(wait_address, &entry->wait); // add_wait_queue(&button_waitq, &entry->wait)
}
这个函数就是将等待对列挂到我们在驱动程序中定义的等待对列:button_waitq中,在这里并不会进入到休眠。
(2)if (ev_press)
mask |= POLLIN;
return mask;
当有按键按下时,产生中断,在中断服务函数中会将ev_press至为1;
当do_pollfd(...) 中调用驱动程序的poll函数时,会检测ev_press,当ev_press==1 时,说明有中断发生,然后mask |= POLLIN 并返回mask
当ev_press == 0, 没有中断发生, mask=0,并返回
然后在do_pollfd(...)将根据mask设置revents;
最后 do_poll(nfds, head, &table, end_time)中,根据返回do_pollfd()返回的mask值,来判断count是否++ ,即当有中断产生的时候,count++,
从而退出do_poll(...)的死循环。
linux-2.6.38poll机制简析(以tiny6410按键中断程序为基础)的更多相关文章
- Linux内核poll/select机制简析
0 I/O多路复用机制 I/O多路复用 (I/O multiplexing),提供了同时监测若干个文件描述符是否可以执行IO操作的能力. select/poll/epoll 函数都提供了这样的机制,能 ...
- Linux VFS机制简析(二)
Linux VFS机制简析(二) 接上一篇Linux VFS机制简析(一),本篇继续介绍有关Address space和address operations.file和file operations. ...
- Linux VFS机制简析(一)
Linux VFS机制简析(一) 本文主要基于Linux内核文档,简单分析Linux VFS机制,以期对编写新的内核文件系统(通常是给分布式文件系统编写内核客户端)的场景有所帮助. 个人渊源 切入正文 ...
- Linux内存管理机制简析
Linux内存管理机制简析 本文对Linux内存管理机制做一个简单的分析,试图让你快速理解Linux一些内存管理的概念并有效的利用一些管理方法. NUMA Linux 2.6开始支持NUMA( Non ...
- Linux驱动之中断处理体系结构简析
S3C2440中的中断处理最终是通过IRQ实现的,在Linux驱动之异常处理体系结构简析已经介绍了IRQ异常的处理过程,最终分析到了一个C函数asm_do_IRQ,接下来继续分析asm_do_IRQ, ...
- Linux 目录结构学习与简析 Part2
linux目录结构学习与简析 by:授客 QQ:1033553122 ---------------接Part 1-------------- #1.查看CPU信息 #cat /proc/cpuinf ...
- Linux 目录结构学习与简析 Part1
linux目录结构学习与简析 by:授客 QQ:1033553122 说明: / linux系统目录树的起点 =============== /bin User Bi ...
- Linux网络性能优化方法简析
Linux网络性能优化方法简析 2010-12-20 10:56 赵军 IBMDW 字号:T | T 性能问题永远是永恒的主题之一,而Linux在网络性能方面的优势则显而易见,这篇文章是对于Linux ...
- Binder机制简析(三)
注册Service Service组件运行在Server进程中,首先要将Service注册到Service Manager中,再启动一个Binder线程池来等待和处理Client的通信请求. 注册过程 ...
随机推荐
- python 时间类型
- Zabbix 3.4.3 使用阿里云短信服务进行报警
目录 一.阿里云短信服务 1.1.首先开通阿里云短信服务 1.2 创建签名 1.3 创建短信模板 1.4 创建发送脚本 二.Zabbix Web 配置 2.1 增加 Media types 2.2 给 ...
- [BAT] SetX 永久设置环境变量
SetX 有三种使用方式: 语法 1: SETX [/S system [/U [domain\]user [/P [password]]]] var value [/M] 语法 2: SETX [/ ...
- Adobe Acrobat 如何通过书签制作多级目录
废话不多说,直接上官方文档 看不清可 右击 > 在新标签页中打开图片
- 31.网络协议介绍tcp/udp
网络协议 TCP:网络中传输数据的协议,打电话 解决了我可能在网络中找不到别人(数据无法传输到) 保证数据传输的稳定性,可靠性 保证数据的安全性,完整性 对方要有响应 尝试重新发送 UDP:传输数据的 ...
- DS博客作业--07查找
目录 DS博客作业--07查找 1.本周学习总结(0--2分) 1.思维导图 2.谈谈你对查找运算的认识及学习体会. 2.PTA实验作业(6分) 2.1.题目1:6-1 二叉搜索树的操作集 (30 分 ...
- Ajax方式上传文件报错"Uncaught TypeError: Illegal invocation"
今天使用ajax上传文件时,出现了错误.数据传输的方式是通过定义formData完成的,提交的文件对象也设置为dom对象,但是还是不能发送请求.F12看到后台报了个错误:Uncaught TypeEr ...
- jsp获取Session中的值
摘要:这个问题算是老生常谈了,我也是一段时间没弄过了,所以感觉有些忘了,就记录一下. 一.后端通过shiro在session中存储数据: // username是前台传过来的用户名 if (subje ...
- Photon Server初识(三) ---ORM映射改进
一:新建一些管理类, 二.实现每个管理类 (1)NHibernateHelper.cs 类,管理数据库连接 using NHibernate; using NHibernate.Cfg; namesp ...
- 基于docker的mongodb安装以及PHP使用
说明:用docker基于单服务器,虚拟多个服务器的方案, 以下是两个config服务器,两个分片,以及每个分片有一个副本的方案 这里关于给mongodb设置远程密码的问题,我采取了用两个compser ...