题目内容
(请给出正确答案)
[单选题]
RDD中的数据被()在集群中,使得任务可以并行执行。
A.顺序存储;
B.连续存储;
C.分块存储;
D.分区存储;
查看答案
如果结果不匹配,请 联系老师 获取答案
A.顺序存储;
B.连续存储;
C.分块存储;
D.分区存储;
A.RDD(ResilientDistributedDataset)叫做弹性分布式数据集,是spark中最基本的数据抽象;
B.Resilient:表示弹性的;
C.Destributed:分布式,可以并行在集群计算;
D.Dataset:就是一个集合,用于存放数据的;
A.当用户应用的数据存储在多个LUN时,可以创建LUN组方便管理
B.在配置基础业务前,必须要先导入license
C.如果业务主机为集群,将集群中的所有主机加入到同一个主机组中
D.如果需要指定具体端口连接到某一个业务主机,需要创建端口组完成相关操作
A.条件独立性假设不成立时,朴素贝叶斯分类器仍有可能产生最优贝叶斯分类器
B.在估计概率值时使用的拉普拉斯修正避免了因训练集样本不充分而导致概率估值为零的问题
C.由于马尔可夫链通常很快就能趋于平稳分布,因此吉布斯采样算法的收敛速度很快
D.二分类任务中两类数据满足高斯分布且方差相同时,线性判别分析产生贝叶斯最优分类器
A.DataNode之间都是独立的,相互之间不会有通信
B.存储客户端上传的数据的数据块
C.一个D,taNode上存储的所有数据块可以有相同的
D.响应客户端的所有读写数据请求,为客户端的存储和读取数据提供支撑