聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。
数据挖掘是一种处理数据,提取数据之间关系的技术。做数据挖掘可分为两种,一种基于算法的研究和程序实现,一种基于数据挖掘软件。
关联规则是指通过对数据库中的数据进行分析,从某一数据对象的信息来推断另一数据对象的信息,寻找出重复出现概率很高的知识模式,常用一个带有置信度因子的参数来描述这种不确定的关系。
总的来说,聚类分析和关联规则属于数据挖掘这个大概念中的两类挖掘问题,聚类分析是无监督的发现数据间的聚簇效应。关联规则是从统计上发现数据间的潜在联系。
想要深入了解三者的关系,推荐咨询CDA数据分析师的课程。CDA课程内容兼顾培养解决数据挖掘流程问题的横向能力以及解决数据挖掘算法问题的纵向能力。要求学生具备从数据治理根源出发的思维,通过数字化工作方法来探查业务问题,通过近因分析、宏观根因分析等手段,再选择业务流程优化工具还是算法工具,而非“遇到问题调算法包”。
点击预约免费试听课。