数量分类学的表征分类的一般过程

如题所述

第1个回答  2016-05-31

为了使用数学工具进行分类,必须首先对性状进行编码,把全部性状状态的记录都改换成数值。不同性状分别采取不同的编码方式:①数值性状,如生物体的长度、体积、重量或实验获得的数据,如果这些数值的大小能够体现分类学意义,通常不必编码,直接使用。②二元性状,表现为肯定和否定两种对立状态的性状,分别以数值0和1编码。通常肯定为1,否定为0。③有序多态性状,表现为3种状态以上,能排列为一定次序的性状,按排列的次序分别以整数给予编码。例如生物体表被毛性状,分无毛、疏毛、多毛和密毛几个状态,分别以数值 0,1,2和3表示。④无序多态性状,表现为3种状态以上,不能排列成一定次序的性状。无序多态性状表现复杂,编码比较困难,可以根据性状的实际意义作适当分解,再进行编码。
如果有t个分类单位,n个性状,编码后获得的数据排成n行t列矩阵,这个矩阵称为原始数值矩阵。 从编码得到的原始数据,不同性状的数值来源不同,单位和量纲不同,因而数值的大小和变化幅度不同。性状之间的这种差异不具有分类意义,需要施行标准化变换给予消除。
分类需要比较分类单位之间相亲性的程度,描述这种相亲性的相似性系数有以下几类:距离系数、相关系数、联合系数和信息系数等。各种系数的数学公式都是以不同的数学方法,从不同的角度综合全部性状,计算两分类单位之间的相似性。计算每一对分类单位的相似性系数,获得一个t阶对称矩阵,称为相似性矩阵。相似性矩阵包含了被分类类群中所有分类单位之间的相似性关系,分类运算将依据这种关系而进行。图2中的数据为桦木科6个属最早计算出来的相似性距离系数。
聚类运算通常采取聚合运算法。运算从相似性矩阵开始,最初把每一个OTU都看作是一个分类群,将最相似的类群归并为新类群。如此重复多次归并,直到所有OTUs都聚合在一起,每次聚合获得新类群,需要计算它与其他类群的相似性系数。这里是分类运算的关键,新相似性系数的计算是否合理,它将影响整个运算过程。不同的计算公式将引出不同的分类方法。 生物分类的结果包含有多个分类群层层隶属的复杂关系,需要采取比较形象的表示方法。分类结果的表示依分类的方法而定,主分量分类法可采取坐标图和体视图,图论分类可画出最小生成树图,分类单位较多时可采取相似性矩阵图。最通常的表示方法是树谱图。依表征分类建立的树谱图称为表征树谱图。图2给出了桦木科数据的树谱图(距离系数)。

相似回答