比特洪流(Bit Torrent)
目录 |
比特洪流是指一种内容分发协议,它通过让用户充当网络转发点的角色来提供高效的软件分发和对于大型文件(比如整部电影和电视节目)点对点的共享。它并不直接向请求资源的用户发送资源,而是通过由拥有资源的用户作为分发者向请求资源的用户发送数据,而后者又可以将自己接收到的资源的部分发送给其他的用户,直到每个人都完成下载。
该技术使得原始服务器可以为很多个大型文件请求服务同时又不需要很大的带宽。根据报告表明,一个用户可以在几个小时的时间内下载完一部标准长度的电影。比特洪流的协议被描述成一种“密集、分散和聚合”的文件传输协议。它是由一个叫做Bram Cohen的人通过Python开发的,并通过开源许可分发到世界各地。
比特洪流是一个基于P2P技术的互联网文件分发协议。它将需要分发的文件切分成一个个块,然后在所有的节点之间传递。它充分利用了每一个节点的下载和上传带宽,绕开了传统C/S模式中的服务器瓶颈问题,因此具有很强的可扩展性,可支持大量用户同时下载某个文件。
1、下载部署
一个典型的BitTorrent网络由一个中心服务器Tracker,若干个数据源节点(seed),以及其它需要下载文件的节点(peer)组成。为了使用BT分发文件,首先要生成一个种子文件(Torrent文件),其中记录了所要分发的文件的许多元信息,如文件名,文件大小,描述等。同时还需要一台中心服务器(Tracker),用来记录所有正在下载这个文件的节点信息。中心服务器的信息,如IP地址等,也需要被记录到种子文件中。下载者通过种子文件找到Tracker,然后得到其它正在下载这个文件的节点信息。图1给出了一个典型的BitTorrent下载流程图。由于Tracker是随机地返回节点链表的,因此不同的节点间形成了一个随机的覆盖网络。
2、邻居节点选择算法
一个新加入的节点P,首先会去向Tracker注册,Tracker在所有的节点中随机地挑选出N个节点(默认的是50个)返回给P,随后P就同这些节点一一建立起连接。以后,如果有其它节点加入这个网络,那么Tracker也会将P的信息告诉给它们。默认的,每个节点最多同35个其它的节点保持连接。当邻居节点的数量小于一定的值(默认为20)时,节点会主动地向Tracker发起请求,要求更多的节点信息。
3、文件块选择算法
对一个下载者来说,在选择下一个被下载的文件块时,通常选择的是它的邻居节点所拥有的最少的那个文件块,也就是所谓的“最少优先原则”。这种技术确保了每个下载者都拥有它的邻居节点最希望得到的那些文件块,从而一旦有需要,下载就可以开始。这样也使得每个节点都优先选择整个系统中最少的那些文件块下载,而那些系统中相对较多的分块被放在后面下载,这样,整个系统就趋向于一种更优的状态。
4、阻塞算法
BitTorrent采用分布式的资源分配策略。每个节点从它的邻居节点处以最快的速度下载所请求的块,同时,它可以自主地通过阻塞算法来选择向哪些节点提供上传服务。
每隔10秒钟,节点就会给那些对自己所拥有的文件块感兴趣的节点进行评估,从而决定它向哪些节点传递数据(默认的配置是允许同时最多给4个节点发送数据)。根据tit-for-tat算法,节点会优先选择那些向自己上传数据速率最快的节点,同时阻塞所有其它的邻居节点。为了提高整体性能,BT还采用了一种叫做“Optimistic unchoke"的算法。也就是除了上述的四个节点之外,它还会在其它的节点中随机选取一个节点向其传递数据。通过这个算法使得新加入的节点可以立即开始下载,同时也能够帮助节点找到上传速率比较好的邻居节点。