首页 > 学历类考试

题目内容（请给出正确答案）

[判断题]

聚类就是分类，它按照数据的相似性和差异性将一组数据分为几个类别，其目的是使得属于同一类别的数据间的相似性尽可能大，但不同类别之间数据的相似性尽可能小，跨类的数据关联性很低。()

查看答案

如果结果不匹配，请联系老师获取答案

您可能会需要：

重置密码查看订单联系客服

安装优题宝APP，拍照搜题省时又省心！

更多“聚类就是分类，它按照数据的相似性和差异性将一组数据分为几个类…”相关的问题

第1题

影响聚类算法效果的主要原因有：（）。

A.特征选取

B.模式相似性测度

C.分类准则

D.已知类别的样本质量

点击查看答案

第2题

分类汇总，就是把资料进行数据化后，先按照某一标准进行分类，然后在分完类的基础上对各类别相关数据分别进行求和、求平均数、求个数、求最大值、求最小值等方法的汇总（）

点击查看答案

第3题

概率模型的训练过程就是（）过程。

A.分类

B.聚类

C.参数估计

D.参数选择

点击查看答案

第4题

现利用已获得的某城市部分房屋地点、楼层、面积和房价数据，构建机器学习模型来预测房价。以下哪类算法满足这个需求（）。

A.回归

B.分类

C.聚类

D.协同过滤

点击查看答案

第5题

快速聚类法又称为动态聚类法，是一种非谱系聚类法，它可以应用于比系统聚类法大得多的数据组。（）

点击查看答案

第6题

某超市研究销售纪录数据后发现，买啤酒的人很大概率也会购买尿布，这种属于数据挖掘的（）问题。

A.关联规则

B.聚类

C.分类

D.自然语言处理

点击查看答案

第7题

当不知道数据所带标签时，能够使用哪一种技术促进带同类标签的数据与带其余标签的数据相分别？（）

A.分类

B.聚类

C.关联分析

D.隐马尔可夫链

点击查看答案

第8题

当不知道数据所带标签时，可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离（）。

A.分类

B.聚类

C.关联分析

D.隐马尔可夫链

点击查看答案

第9题

K-means++算法选择初始seeds的基本思想就是：初始的聚类中心之间的相互距离要尽可能的远。那么算法流程为（）。1.从输入的数据点集合中随机选择一个点作为第一个聚类中心2.对于数据集中的每一个点x，计算它与最近聚类中心（指已选择的聚类中心）的距离D（x）3.选择一个新的数据点作为新的聚类中心，选择的原则是：D（x）较大的点，被选取作为聚类中心的概率较大4.重复2和3直到k个聚类中心被选出来5.利用这k个初始的聚类中心来运行标准的k-means算法。

A.2.5.4.3.1

B.1.5.4.2.3

C.1.2.3.4.5

D.4.3.2.1.5

点击查看答案

第10题

机器学习中，“降维”是指通过保留一些比较重要的特征，去除一些冗余的特征，从而减少数据特征的维度。如：当我们需要处理大量文章的主题分析时，可以通过__算法，结合潜在语义分析（LSA），对文章中的词汇进行聚类（如“万科”和“地产”聚类的关联度要大于“万科”和“王者荣耀”）。之后，按照聚类出现的效果，可以提取文档集合中的近义词，这样当用户检索文档的时候，是用语义级别（近义词集合）去检索了，而不是之前的词的级别，即实现了降维（）

点击查看答案

第11题

根据分类的原理，我们可以把聚类分为样品聚类和变量聚类。（）

点击查看答案

违法和不良信息举报电话：400-118-7898

举报/反馈/投诉邮箱：deng＃ujigu.com（请将＃替换成@）