华南理工大学学报(自然科学版) ›› 2010, Vol. 38 ›› Issue (4): 162-166.doi: 10.3969/j.issn.1000-565X.2010.04.029

• 计算机科学与技术 • 上一篇    

随机分组抽样下流大小分布估计

张海 许勇 张凌   

  1. 华南理工大学 计算机科学与工程学院, 广东 广州 510640
  • 收稿日期:2009-04-24 修回日期:2009-09-16 出版日期:2010-04-25 发布日期:2010-04-25
  • 通信作者: 张海(1972-),男,博士生,主要从事网络管理和网络测量研究 E-mail:zhangh@139.com
  • 作者简介:张海(1972-),男,博士生,主要从事网络管理和网络测量研究
  • 基金资助:

    国家“973”计划项目(2009CB320505)

Estimation of Flow Size Distribution During Random Packet Sampling

Zhang Hai  Xu Yong  Zhang Ling   

  1. School of Computer Science and Engineering,South China University of Technology,Guangzhou 510640,Guangdong,China
  • Received:2009-04-24 Revised:2009-09-16 Online:2010-04-25 Published:2010-04-25
  • Contact: 张海(1972-),男,博士生,主要从事网络管理和网络测量研究 E-mail:zhangh@139.com
  • About author:张海(1972-),男,博士生,主要从事网络管理和网络测量研究
  • Supported by:

    国家“973”计划项目(2009CB320505)

摘要: 为提高流大小分布估计的精度,比较了运用TCP流的SYN包和TCP序列号信息的几种极大似然估计(MLE)算法.结果表明,运用TCP流中的SYN包和SEQ信息对流大小的分布估计比单纯的抽样估计具有更高的准确性,其中在样本流中同时运用SYN包和SEQ信息的估计效果最佳.在此基础上结合实际提出了一种对小流采取细粒度、对大流采取粗粒度的流大小非均匀粒度分布估计算法,并以实例验证了该方法的适用性.结果表明,该方法在减少算法计算量的情况下,提高了对大流的估计精度.

关键词: 分组抽样, 流大小, 分布估计, 网络测量

Abstract:

In order to improve the estimation accuracy of flow size distribution,several maximum likelihood estimate(MLE) algorithms using SYN flag information and TCP sequence numbers are compared.The results show that the algorithms using SYN flag and SEQ information in TCP flow,especially the algorithm using both SYN flag and SEQ sequence numbers,are more accurate than the simple sampling estimation.Then,a nonuniform grained estimation algorithm of flow size is proposed,which implements the estimation with fine-grained estimators for the flow with small size and coarse-grained ones for the flow with large size.Case study demonstrates that the proposed algorithm is applicable and greatly improves the estimation accuracy of large-size flow with less computation.

Key words: packet sampling, flow size, distribution estimation, network measurement