简述
     MPTCP在进行三次握手之后,客户端和服务端会进行地址信息的交换,让对方知道彼此未用的地址信息。
当客户端知道服务端的地址后就可以建立其他子路径。三次握手和建立子路径的过程如图1:
                                       图1
关于Token、随机数R、以及HMAC(Hash-based Message Authentication Code)的详细解释可以阅读参考文献[1]。
 
MPTCP的内核实现:
     这里我们主要关注建立子路径过程中,master sock对slave sock的影响。当客户端发送第一个SYN准备建立子路径的时候就会调用
mptcp_init4_subsockets来创建一个新的socket和相应的sock。
 
 "net/mptcp/mptcp_ipv4.c" line  of
int mptcp_init4_subsockets(struct sock *meta_sk, const struct mptcp_loc4 *loc,
struct mptcp_rem4 *rem)
{
struct tcp_sock *tp;
struct sock *sk;
struct sockaddr_in loc_in, rem_in;
struct socket sock;
int ulid_size = , ret; /** First, create and prepare the new socket */ sock.type = meta_sk->sk_socket->type;
sock.state = SS_UNCONNECTED;
sock.wq = meta_sk->sk_socket->wq;
sock.file = meta_sk->sk_socket->file;
sock.ops = NULL; ret = inet_create(sock_net(meta_sk), &sock, IPPROTO_TCP, );
if (unlikely(ret < )) {
mptcp_debug("%s inet_create failed ret: %d\n", __func__, ret);
return ret;
} sk = sock.sk;
tp = tcp_sk(sk);
第345行的函数inet_create创建了子路径的socket和sock。
 
     /* All subsockets need the MPTCP-lock-class */
lockdep_set_class_and_name(&(sk)->sk_lock.slock, &meta_slock_key, "slock-AF_INET-MPTCP");
lockdep_init_map(&(sk)->sk_lock.dep_map, "sk_lock-AF_INET-MPTCP", &meta_key, ); if (mptcp_add_sock(meta_sk, sk, loc->loc4_id, rem->rem4_id, GFP_KERNEL))
goto error; tp->mptcp->slave_sk = ;
tp->mptcp->low_prio = loc->low_prio; /* Initializing the timer for an MPTCP subflow */
setup_timer(&tp->mptcp->mptcp_ack_timer, mptcp_ack_handler, (unsigned long)sk);
第358行的mptcp_add_sock将master sock 和 子路径的sock联系起来。第361行表面此sock为 slave subsock。
第362行设置此子路径是否为备用路径。只有现在路径都不可用的情况下,才会通过备用子路径发送数据。
第365行设置的定时器用于重发建立子路径的最后一个ACK,这样做是为了保证上图中的HMAC-A可以送达。
 
     ulid_size = sizeof(struct sockaddr_in);
loc_in.sin_family = AF_INET;
rem_in.sin_family = AF_INET;
loc_in.sin_port = ;
if (rem->port)
rem_in.sin_port = rem->port;
else
rem_in.sin_port = inet_sk(meta_sk)->inet_dport;
loc_in.sin_addr = loc->addr;
rem_in.sin_addr = rem->addr; ret = sock.ops->bind(&sock, (struct sockaddr *)&loc_in, ulid_size);
if (ret < ) {
mptcp_debug("%s: MPTCP subsocket bind() failed, error %d\n",
__func__, ret);
goto error;
} mptcp_debug("%s: token %#x pi %d src_addr:%pI4:%d dst_addr:%pI4:%d\n",
__func__, tcp_sk(meta_sk)->mpcb->mptcp_loc_token,
tp->mptcp->path_index, &loc_in.sin_addr,
ntohs(loc_in.sin_port), &rem_in.sin_addr,
ntohs(rem_in.sin_port)); if (tcp_sk(meta_sk)->mpcb->pm_ops->init_subsocket_v4)
tcp_sk(meta_sk)->mpcb->pm_ops->init_subsocket_v4(sk, rem->addr); ret = sock.ops->connect(&sock, (struct sockaddr *)&rem_in,
ulid_size, O_NONBLOCK);
if (ret < && ret != -EINPROGRESS) {
mptcp_debug("%s: MPTCP subsocket connect() failed, error %d\n",
__func__, ret);
goto error;
}
第380行是将子路径的socket的与地址绑定。第396行此套接字将会调用tcp_v4_connect进行连接操作。
 
     sk_set_socket(sk, meta_sk->sk_socket);
sk->sk_wq = meta_sk->sk_wq; return ; error:
/* May happen if mptcp_add_sock fails first */
if (!mptcp(tp)) {
tcp_close(sk, );
} else {
local_bh_disable();
mptcp_sub_force_close(sk);
local_bh_enable();
}
return ret;
}
第404和405行将子路径的sk和master的socket建立联系,因为对于应用程序来说只有
master的socket是可见,而slave subsock的socket是不可见。
 
下面的情景是服务端收到上图1中ACK/MP_JOIN(HMAC-A)包,这时状态将由SYN_RECV变为ESTABLISHED。函数的调用
关系如下:
tcp_v4_rcv
          =》tcp_v4_do_rcv
               =》mptcp_v4_do_rcv
                    =》tcp_v4_hnd_req
                         =》tcp_check_req
                              =》mptcp_check_req_child
                                    =》mptcp_add_sock
 
在函数tcp_check_req中将会建立新的sock。主要代码如下:
"net/ipv4/tcp_minisocks.c" line  of
/* OK, ACK is valid, create big socket and
761 * feed this segment to it. It will repeat all
762 * the tests. THIS SEGMENT MUST MOVE SOCKET TO
763 * ESTABLISHED STATE. If it will be dropped after
764 * socket is created, wait for troubles.
765 */
#ifdef CONFIG_MPTCP
if (mptcp(tcp_sk(sk)))
/* MPTCP: We call the mptcp-specific syn_recv_sock */
child = tcp_sk(sk)->mpcb->syn_recv_sock(sk, skb, req, NULL);
else
#endif
child = inet_csk(sk)->icsk_af_ops->syn_recv_sock(sk, skb,
req, NULL); if (child == NULL)
goto listen_overflow;
第769行将会调用mptcp_syn_recv_sock和tcp_v4_syn_recv_sock和tcp_create_openreq_child创建新的sock并进行初始化。
函数mptcp_check_req_child和mptcp_add_sock会将此sock和master sock建立联系,并且设置此sock的属性slave_sk为1. 
 
结论:
1. MPTCP利用Token、随机数R、以及HMAC(Hash-based Message Authentication Code)这些信息的交换保证构建子路径正确。
2.sub sock是在meta sock基础上建立,只有meta对于应用层是可见,其余sub sock并不可见。
 
 
参考文献:
 
问题:
1.第394行函数作用未知?
 
2.函数mptcp_v4_add_lsrr的功能?

MPTCP 源码分析(二) 建立子路径的更多相关文章

  1. MPTCP 源码分析(五) 接收端窗口值

    简述:      在TCP协议中影响数据发送的三个因素分别为:发送端窗口值.接收端窗口值和拥塞窗口值. 本文主要分析MPTCP中各个子路径对接收端窗口值rcv_wnd的处理.   接收端窗口值的初始化 ...

  2. Alink漫谈(十六) :Word2Vec源码分析 之 建立霍夫曼树

    Alink漫谈(十六) :Word2Vec源码分析 之 建立霍夫曼树 目录 Alink漫谈(十六) :Word2Vec源码分析 之 建立霍夫曼树 0x00 摘要 0x01 背景概念 1.1 词向量基础 ...

  3. 十、Spring之BeanFactory源码分析(二)

    Spring之BeanFactory源码分析(二) 前言 在前面我们简单的分析了BeanFactory的结构,ListableBeanFactory,HierarchicalBeanFactory,A ...

  4. 框架-springmvc源码分析(二)

    框架-springmvc源码分析(二) 参考: http://www.cnblogs.com/leftthen/p/5207787.html http://www.cnblogs.com/leftth ...

  5. Vue源码分析(二) : Vue实例挂载

    Vue源码分析(二) : Vue实例挂载 author: @TiffanysBear 实例挂载主要是 $mount 方法的实现,在 src/platforms/web/entry-runtime-wi ...

  6. Fresco 源码分析(二) Fresco客户端与服务端交互(1) 解决遗留的Q1问题

    4.2 Fresco客户端与服务端的交互(一) 解决Q1问题 从这篇博客开始,我们开始讨论客户端与服务端是如何交互的,这个交互的入口,我们从Q1问题入手(博客按照这样的问题入手,是因为当时我也是从这里 ...

  7. Tomcat源码分析二:先看看Tomcat的整体架构

    Tomcat源码分析二:先看看Tomcat的整体架构 Tomcat架构图 我们先来看一张比较经典的Tomcat架构图: 从这张图中,我们可以看出Tomcat中含有Server.Service.Conn ...

  8. 多线程之美8一 AbstractQueuedSynchronizer源码分析<二>

    目录 AQS的源码分析 该篇主要分析AQS的ConditionObject,是AQS的内部类,实现等待通知机制. 1.条件队列 条件队列与AQS中的同步队列有所不同,结构图如下: 两者区别: 1.链表 ...

  9. ReactNative 4Android源码分析二: 《JNI智能指针之实现篇》

    文/Tamic http://blog.csdn.net/sk719887916/article/details/53462268 回顾 上一篇介绍了<ReactNative4Android源码 ...

随机推荐

  1. [ 总结 ] vsftpd 虚拟用户配置

    需求:在不更改目录权限的前提下,ftp用户对目录里的文件拥有所有权. [root@server2 ~]# yum install vsftpd -y [root@server2 ~]# cd /etc ...

  2. 最小生成树Prim算法Kruskal算法

    Prim算法采用与Dijkstra.Bellamn-Ford算法一样的“蓝白点”思想:白点代表已经进入最小生成树的点,蓝点代表未进入最小生成树的点. 算法分析 & 思想讲解: Prim算法每次 ...

  3. 【计算机网络】http状态码

    100-199 用于指定客户端应相应的某些动作. 200-299 用于表示请求成功. 300-399 用于已经移动的文件并且常被包含在定位头信息中指定新的地址信息. 400-499 用于指出客户端的错 ...

  4. Selenium2+python自动化-gird分布式(转载)

    本篇转自博客:上海-小T 原文地址:http://blog.csdn.net/real_tino/article/details/53467406 Selenium grid是用来分布式执行测试用例脚 ...

  5. 大数据量的Mysql数据库备份策略

    Centos下mysql常用的三种备份方法 http://www.centoscn.com/CentOS/Intermediate/2013/0807/1160.html xtrabackup备份 h ...

  6. Linux上安装Redis教程

    Redis的安装步骤: 步骤1.安装redis必须已经安装了gcc,如果没安装gcc 就使用命令 yum install -y gcc步骤2.下载redis包 下载地址:http://download ...

  7. Codeforces 811 C. Vladik and Memorable Trip

    C. Vladik and Memorable Trip   time limit per test 2 seconds memory limit per test 256 megabytes inp ...

  8. 递归输入与引用传值(UVa839 Not so Mobile)

    题目的大意是一个树形天平,输入给出样例的个数,然后空一行,每行4个数W1,D1,W2,D2,分别代表天平左侧的重量.力臂和天平右侧的重量.力臂.如果W1或者W2为0,则代表该节点有左子树或右子树,如果 ...

  9. SPOJ CIRU - The area of the union of circles (圆的面积并)

    CIRU - The area of the union of circles no tags  You are given N circles and expected to calculate t ...

  10. [P1580] yyy loves Easter_Egg I

    Link: P1580 传送门 Solution: 拿来练练字符串的读入: 1.$gets()$相当于$c++$中的$getline()$,但返回值为指针!(无数据时为NULL) (都读入换行符,并将 ...