# 基础学科拔尖学生培养试验计划
**Source**: https://bjjh.pku.edu.cn/peking/jsp/jspeditor9/to/facade.jsp?dispatch=viewObject&id=13&af=/bajian/viewObjectOk.jsp&editor_banner_longb=2&editor_longb=324&longa=9
**Parent**: https://bjjh.pku.edu.cn/peking/bajian/index.jsp
数学科学学院学生刘浩洋于2014年6月-9月赴威斯康辛大学麦迪逊分校进行学术交流,
暑假在UW-Madison Karl Rohe教授的组里做关于网络上统计推断的工作。我主要致力于系统聚类法的理论分析。传统的系统聚类算法已经被写进了教科书,可以说是经典算法,但这一算法却没有太多的统计理论保障。这其中的原因是通常divisive的聚类算法或者有等价的divisive刻画的聚类算法比较容易研究理论,但一般的agglomerative算法比较难于下手。对于系统聚类来说,我们要定义类间的距离,比较常用的有最短距离,平均距离。其中最短距离就属于有简单的等价的divisive刻画的算法,它的consistency也已经建立起来,但是平均距离就难于研究。但在生活中,人们却广泛地应用了平均距离,之后的研究多集中于提出新的系统聚类算法,传统的平均距离法没有得到太多的理论研究。
我们的研究集中在网络上的平均距离系统聚类法上。在第一项工作中,我们采取block-modeling的方法,希望建立起平均距离法的consistency并研究其理论性质以及和最短距离的差异。在2-block stochastic blockmodel下,我们给出了consistency条件。比这结果更有意思的是,我们给出的完美重建的充分条件将平均距离法与图的Ratio-Cut联系在一起,从而使block的形态对算法的表现的影响明朗起来,并且自然使我们在证明中用到cheeger bound。在第二项工作中,我们在Gaussian Blockmodel下研究平均距离法的稳健型,我们证明了平均距离法对于正比于总结点数的误差是可以容忍的,从而说明了平均距离法和最短距离法的重要差异。
暑假的科研经历给了我非常宝贵的学习机会,并且有机会和一流的统计学家和数学家交流,让我受益匪浅。