主讲人:周建博士(清华大学工业工程系)
周建,清华大学工业工程系副教授。1998年毕业于清华大学数学系,2003年于清华大学数学系获理学博士学位,同年11月至法国昂热大学计算机系从事博士后研究,2004年11月加入清华大学工业工程系至今,2008年获硕士生导师资格,2009年获副教授职称。主要研究兴趣包括:模糊聚类及其在数据挖掘领域的应用,商业数据中的信息提取与风险分析,物流与供应链管理,不确定环境下的建模与优化等。
聚类分析是对已知数据按照相似程度进行分类的理论和方法,在模式识别、信息提取等众多领域中有着广泛的应用。在实际问题中,数据的隶属信息往往并不清晰,或者数据是由自然语言来表述的,很难被明确的分类。模糊聚类分析是基于模糊集理论的一种动态聚类方法,在分析这类数据时往往能够提供更全面的分类信息,这在实际应用尤其是商业数据以及有关人的行为数据的分析中是非常有用的。本报告主要介绍模糊聚类方法的发展历程和最新成果,包括模糊c均值聚类、可能性聚类和可信性聚类方法等,并简单介绍模糊聚类算法在商业数据挖掘、图像分割和文本聚类等领域的应用。
涉及事物之间的模糊界限时按一定要求对事物进行分类的数学方法。聚类分析是数理统计中的一种多元分析模糊聚类分析
方法,它是用数学方法定量地确定样本的亲疏关系,从而客观地划分类型。事物之间的界限,有些是确切的,有些则是模糊的。例如人群中的面貌相像程度之间的界限是模糊的,天气阴、晴之间的界限也是模糊的。当聚类涉及事物之间的模糊界限时,需运用模糊聚类分析方法。模糊聚类分析广泛应用在气象预报、地质、农业、林业等方面。通常把被聚类的事物称为样本,将被聚类的一组事物称为样本集。模糊聚类分析有两种基本方法:系统聚类法和逐步聚类法。在职研究生网