路由协议Kademlia基本模型
传统的路由协议中,往往会有中心化的服务器,来为寻找对方节点提供服务,如果需要实现2点互联,需要大家都到同一个中心服务器注册。这样可以根据用户的唯一识别信息,为2方建立连接。在去中心化的系统中,没有人管理和维护每个节点的信息,节点与节点之间需要互联,就需要通过一定的算法和方式来寻找对方,识别对方,并建立连接。每个节点有一个全局唯一的node_id标示,表示一个在线的网络节点。为了讲解方便,我们将id的表示范围缩小到4位bit内,即当前我们测试网络最大只支持2的4次方,即16个节点,如上图,中心化路由和去中心化路由的网络拓扑结构示意图。
为了能快速找到网络中的其他节点,并维护一种网络连接关系,需要计算当前节点w与其它节点之间的距离,在kademlia的这种DHT设计中,采用了比特位异或操作来计算2个节点的距离,然后根据距离来维护网络路由信息的方式,注意这里的距离不是物理距离,而是节点ID之间的比特位距离。
首先是异或操作,如果2个比特位的值相同,那么异或操作的结果为0,如果2个比特位的值不同,那么操作结果为1,以此方式来计算2个网络节点的id的距离,如图中,我们假设节点w的id值为0011,那么他与目标节点1110的距离计算如上图表示,结果为1101。根据此操作,我们引申出下面的计算。
即从第0位开始,寻找与本节点0011这个id不同的节点id,如上图所示,第0位不同的节点有1个,其前3位都是001,只有最后一位不同,其距离本节点的距离是1,从第1位开始,与本节点不同的节点有2个他们是0000,0001,他们与本节点的id有共同的00开头,从第2位开始与本节点id不同的有4种,他们是0100,0101,0110,0111,他们与本节点拥有共同的开头0,从第3位开始不同的有8种,他们是以1开头,并且后面三位的取值为0或者1,此类节点与本节点的id没有共同的开头。通过这种计算,我们可以把距离节点0011的节点根据距离,划分到不同的类别中,其中,第0位开始的节点距离本节点的距离是1,第1位开始的节点距离是2-3,第2位开始的节点距离4-7,第3为开始的节点距离为8-15。以此类推从第i个开始的节点距离当前节点为【2^i, 2^(i+1) - 1】。如果我们把上图的结果以二叉树的方式表示出来如下图。
区域1,2,3,4分别对应上图中的从第0,1,2,3位开始与本节点0011的id不同的节点群。二叉树的路径表示的节点编号的每一位的bit位的值。叶节点就是网络节点编号,他的值就是从根节点开始到达该叶节点的路径。
有了以上的设计图,我们再从某节点x发出寻找目标节点o的时候,我们就会根据上面的知识,首先计算目标节点与本节点的距离,然后从符合距离的一群节点中,找出不在自己所在的半区的节点群的,与目标节点距离比自己短一半的某中继节点r1,然后r1再从自己的路由距离表中,找出比r1距离目标节点o更短一半的节点中继节点r2,这样迭代下去,就可以找到目标节点o。这样的寻路方式,如果全网有n个节点,那么最坏的查找速度也是n的2底对数,这是一个非常快的查找算法,如果有100万个节点,那么最多20次查找就可以找到目标节点。
当然这是kademlia的简单的理想的模型,在此模型的基础上,我们会增加很多机制来优化这种理想模型,是他符合现实网络的实际情况。我们在下一节中会继续讲解。