关于混合模型聚类算法的优缺点,下面说法正确的是()。
A.当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理
B.混合模型比K均值或模糊c均值更一般,因为它可以使用各种类型的分布
C.混合模型很难发现不同大小和椭球形状的簇
D.混合模型在有噪声和离群点时不会存在问题
A.当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理
B.混合模型比K均值或模糊c均值更一般,因为它可以使用各种类型的分布
C.混合模型很难发现不同大小和椭球形状的簇
D.混合模型在有噪声和离群点时不会存在问题
A.K-means算法初始质心问题可通过多次运行来解决
B.层次聚类的时间复杂度是O(N2)
C.DBSCAN算法忽略掉噪声点
D.聚类评估外部指标有SSE,Cohesion,Separation
A.DBSCAN算法是一种基于划分的聚类算法
B.DBSCAN算法将点分成核心点、边界点和噪音点三类
C.DBSCAN算法是一种基于密度的聚类算法
D.DBSCAN算法需要在指定簇的个数
A.聚类的目的是根据人们所关心的相似关系,寻找数据中潜在的自然分组结构
B.依据被研究对象的不同,聚类算法能够被划分为Q型聚类和R型聚类
C.依据算法结构的不同,聚类算法能够被划分为自下而上与自上而下
D.使用聚类算法时一定需要每个样本的标签
A.DBSCAN是一种著名的密度聚类算法
B.密度聚类从样本数量的角度来考察样本之间的可连接性
C.密度聚类基于不可连接样本不断扩展聚类簇易获得最终的聚类结果
D.密度直达关系通常满足对称性
A.ID3算法要求特征必须离散化
B.信息增益可以用熵,而不是GINI系数来计算
C.选取信息增益最大的特征,作为树的根节点
D.ID3算法是一个二叉树模型,即每个节点最多有两个分支
A.信息增益选择特征偏向于纯度较好的特征作为优先项
B.信息熵是度量样本纯度最常用的一种指标
C.ID3算法不仅能处理离散型数据,还能处理连续型数据
D.ID3算法可能会导致模型的泛化能力下降的问题