内核通信之Netlink源码分析-用户内核通信原理3

2017-07-06

上节主讲了用户层通过netlink和内核交互的详细过程，本节分析下用户层接收数据的过程……

有了之前基础知识的介绍，用户层接收数据只涉及到一个核心调用readmsg()，

其他的就不多介绍了，不太明白的请参考之前的文章，我们还是重点看下内核究竟在背后做了什么！该函数在内核对应于read_msg系统调用

SYSCALL_DEFINE3(recvmsg, int, fd, struct msghdr __user *, msg,

        unsigned int, flags)

{

    if (flags & MSG_CMSG_COMPAT)

        return -EINVAL;

    return __sys_recvmsg(fd, msg, flags);

}

没什么特殊的，调用了__sys_recvmsg

long __sys_recvmsg(int fd, struct msghdr __user *msg, unsigned flags)

{

    int fput_needed, err;

    struct msghdr msg_sys;

    struct socket *sock;

    /*根据找到对应socket结构*/

    sock = sockfd_lookup_light(fd, &err, &fput_needed);

    if (!sock)

        goto out;

    err = ___sys_recvmsg(sock, msg, &msg_sys, flags, );

    fput_light(sock->file, fput_needed);

out:

    return err;

}

这里主要分为两部分1、根据传递进来的fd找到内核中的socket数据结构。2、调用___sys_recvmsg执行剩余的工作，前者在发送数据的时候已经进行过介绍，这里就不再赘述。直接看___sys_recvmsg，该函数比较长我们还是分部来看。

if (MSG_CMSG_COMPAT & flags) {

        if (get_compat_msghdr(msg_sys, msg_compat))

            return -EFAULT;

    } else if (copy_from_user(msg_sys, msg, sizeof(struct msghdr)))

        return -EFAULT;

    if (msg_sys->msg_iovlen > UIO_FASTIOV) {

        err = -EMSGSIZE;

        if (msg_sys->msg_iovlen > UIO_MAXIOV)

            goto out;

        err = -ENOMEM;

        iov = kmalloc(msg_sys->msg_iovlen * sizeof(struct iovec),

                  GFP_KERNEL);

        if (!iov)

            goto out;

    }

首先自然是获取头部msghdr信息，注意参数中的msghdr指针为用户空间的地址，所以我们需要在内核中构建一个msghdr，把用户空间结构的内容拷贝到内核中，如果flag字段有MSG_CMSG_COMPAT，则直接使用内核指针访问用户空间的msghdr的属性字段。否则使用copy_from_user把整个结构复制过来。前面文章介绍过msghdr并不直接管理数据，而是通过iov向量。这里如果msg_sys->msg_iovlen超过UIO_FASTIOV，这种情况还有回旋的余地，如果没有超过UIO_MAXIOV，则在内核分配多出UIO_FASTIOV的iov向量，因为前面已经在内核栈中分配好了UIO_FASTIOV数量的内核iov，接下来的工作就比较简单，需要把用户空间iov里记录的信息复制到内核空间的iov中，代码如下，

uaddr = (__force void __user *)msg_sys->msg_name;

    uaddr_len = COMPAT_NAMELEN(msg);

    /*修改iov信息*/

    if (MSG_CMSG_COMPAT & flags) {

        err = verify_compat_iovec(msg_sys, iov, &addr, VERIFY_WRITE);

    } else

        err = verify_iovec(msg_sys, iov, &addr, VERIFY_WRITE);

    if (err < )

        goto out_freeiov;

    total_len = err;

接下来略过一些控制检查就该处理数据了，

cmsg_ptr = (unsigned long)msg_sys->msg_control;

    msg_sys->msg_flags = flags & (MSG_CMSG_CLOEXEC|MSG_CMSG_COMPAT);

    if (sock->file->f_flags & O_NONBLOCK)

        flags |= MSG_DONTWAIT;

    err = (nosec ? sock_recvmsg_nosec : sock_recvmsg)(sock, msg_sys,

                              total_len, flags);

我们分析sock_recvmsg，在快速处理的时候会使用sock_recvmsg_nosec，回想下在发送数据的时候有个used_address，即如果当前地址和上次发送使用的地址一样，则调用快速处理函数。这里也是同样的道理。在sock_recvmsg中主要调用了__sock_recvmsg继而调用了__sock_recvmsg_nosec，最终调用到sock->ops->recvmsg,针对netlink，这里就是netlink_recvmsg,针对该函数抛开现象看本质的话还是挺清晰的，主要分为两步

1、从指定的sock接收队列中取出一个skb

2、把skb中的数据复制到用户空间的内存中

前者由skb_recv_datagram函数完成，该函数又调用了__skb_recv_datagram,在该函数中涉及到一个MSG_PEEK标志，如果flags字段设置了该标志，则从接收队列中取出skb后不会把skb从队列中删除，所以这样就需要另一个参数off来确定本次需要的是哪个skb.如果没有设置，则得到一个skb后会把skb从队列中删除，这样实际上每次取队列中的首个就可以了，核心代码如下。

struct sk_buff_head *queue = &sk->sk_receive_queue;

        int _off = *off;

        last = (struct sk_buff *)queue;

        spin_lock_irqsave(&queue->lock, cpu_flags);

        /*遍历循环双链表*/

        skb_queue_walk(queue, skb) {

            last = skb;

            *peeked = skb->peeked;

            if (flags & MSG_PEEK) {

                if (_off >= skb->len && (skb->len || _off ||

                             skb->peeked)) {

                    _off -= skb->len;

                    continue;

                }

                skb->peeked = ;

                atomic_inc(&skb->users);

            } else

                __skb_unlink(skb, queue);

            spin_unlock_irqrestore(&queue->lock, cpu_flags);

            *off = _off;

            return skb;

        }

在获取到skb之后，下面该复制数据了，具体由skb_copy_datagram_iovec函数完成，完成后更新了下msg->msgname和msg_namelen字段。看下skb_copy_datagram_iovec复制函数，该函数也比较清晰，但是涉及到skb的组织方式，又稍显复杂，本节不打算很详细的讲述skb的组织，后面单独开一节来介绍，该函数主要分为三部分：

1、复制头部

2、复制分片

3、复制子skb

该部分内容在详细介绍skb的时候再做介绍，这样复制到iov中后，接收过程就完成了，用户空间就可以正常读取数据了……

以马内利

参考资料

linux3.10.1内核源码

内核通信之Netlink源码分析-用户内核通信原理3的更多相关文章

内核通信之Netlink源码分析-用户内核通信原理2
2017-07-05 上文以一个简单的案例描述了通过Netlink进行用户.内核通信的流程,本节针对流程中的各个要点进行深入分析 sock的创建 sock管理结构 sendmsg源码分析 sock的 ...
内核通信之Netlink源码分析-用户内核通信原理
2017-07-05 本节从一个小案例入手,结合源码分析下通过netlink进行内核和用户通信的流程. 内核端按照传统CS模式,其实内核端可以作为是服务器端,用以接收用户的请求并作出处理,但是从ne ...
内核通信之Netlink源码分析-基础架构
2017-07-04 netlink是一种基于网络的通信机制,一般用于内核内部或者内核与用户层之间的通信.其有一个明显的特点就是异步性,通信的双方不要求同时在线,也就不用阻塞等待.NetLink按照数 ...
v79.01 鸿蒙内核源码分析(用户态锁篇) | 如何使用快锁Futex(上) | 百篇博客分析OpenHarmony源码
百篇博客分析|本篇为:(用户态锁篇) | 如何使用快锁Futex(上) 进程通讯相关篇为: v26.08 鸿蒙内核源码分析(自旋锁) | 当立贞节牌坊的好同志 v27.05 鸿蒙内核源码分析(互斥锁) ...
jQuery 2.0.3 源码分析Sizzle引擎解析原理
jQuery 2.0.3 源码分析Sizzle引擎 - 解析原理声明:本文为原创文章,如需转载,请注明来源并保留原文链接Aaron,谢谢! 先来回答博友的提问: 如何解析 div > p + ...
wifidog源码分析 - 用户连接过程
引言之前的文章已经描述wifidog大概的一个工作流程,这里我们具体说说wifidog是怎么把一个新用户重定向到认证服务器中的,它又是怎么对一个已认证的用户实行放行操作的.我们已经知道wifidog ...
Linux内核2.6.14源码分析-双向循环链表代码分析(巨详细)
Linux内核源码分析-链表代码分析分析人:余旭分析时间:2005年11月17日星期四 11:40:10 AM 雨温度:10-11度编号:1-4 类别:准备工作 Email:yuxu97101 ...
SOFA 源码分析 — 自定义线程池原理
前言在 SOFA-RPC 的官方介绍里,介绍了自定义线程池,可以为指定服务设置一个独立的业务线程池,和 SOFARPC 自身的业务线程池是隔离的.多个服务可以共用一个独立的线程池. API使用方式如 ...
【MyBatis源码分析】插件实现原理
MyBatis插件原理----从<plugins>解析开始本文分析一下MyBatis的插件实现原理,在此之前,如果对MyBatis插件不是很熟悉的朋友,可参看此文MyBatis7:MyB ...

随机推荐

oracle的varchar2和clob类型在hibernate中使用
1.在oracle中 varchar2的最大长度为4000 bytes,即varchar2(4000),最多能储存2000个汉子或4000位的数字字母.当储存值超过时可以使用clob(Characte ...
vc 找到一个或多个多重定义的符号
vc 找到一个或多个多重定义的符号, 这个问题还是不能很好的解决. 最根本的是: 把所有有关定义的部分都放在.cpp文件中,对应的.h文件中只放声明.这样在#include ""的 ...
jquery插件大全
241个jquery插件—jquery插件大全免费JQuery插件推荐12款非常有用的流行 jQuery 插件
centos7 systemctl
下机为systemctl指令systemctl enable *.service #开机运行服务systemctl disable *.service #取消开机运行systemctl start * ...
mysql数据库中,通过mysqladmin工具,创建数据库
需求描述: 今天接触到了mysqladmin工具,主要是一个客户端工具,用来管理mysql server的可以通过mysqladmin直接创建数据库,而不需要登录到mysql控制台中,在此记录下. ...
mongodb启动时报错ERROR: child process failed, exited with error number 1
不多说,直接上干货! 前期博客 Ubuntu14.04下Mongodb安装部署步骤(图文详解) Ubuntu16.04下Mongodb安装部署步骤(图文详解) root@zhouls-virtual- ...
python 2.0 s12 day5 常用模块介绍
模块,用一砣代码实现了某个功能的代码集合. 类似于函数式编程和面向过程编程,函数式编程则完成一个功能,其他代码用来调用即可,提供了代码的重用性和代码间的耦合.而对于一个复杂的功能来,可能需要多个函数才 ...
java集合的中的集合关系实现或继承关系图
放在这儿一目了然.
[笔试题]黑板上写下50个数字，选两个黑板上数字a和b，在黑板写|b-a|，剩下的数字?
在黑板上写下50个数字:1至50.在接下来的49轮操作中,每次做如下操作:选取两个黑板上的数字a和b,擦去,在黑板上写|b-a|.请问最后一次动作之后剩下的数字可能是什么?为什么?(不用写代码,不写原 ...
Android 使用线性布局LinearLayout和Button实现一个点红块游戏
这个游戏的功能类似打地鼠. 项目地址:https://github.com/moonlightpoet/RedBlock 程序下载试玩地址:https://github.com/moonlightpo ...

内核通信之Netlink源码分析-用户内核通信原理3

内核通信之Netlink源码分析-用户内核通信原理3的更多相关文章

随机推荐

热门专题