首页 > 财会类考试

题目内容（请给出正确答案）

[单选题]

梯度爆炸问题是指在训练深度神经网络的时候，梯度变得过大而损失函数变为无穷。在RNN中，下面哪种方法可以较好地处理梯度爆炸问题？（）

A.用改良的网络结构比如LSTM和GRUs

B.梯度裁剪

C.Dropout

D.所有方法都不行

查看答案

如果结果不匹配，请联系老师获取答案

您可能会需要：

重置密码查看订单联系客服

安装优题宝APP，拍照搜题省时又省心！

更多“梯度爆炸问题是指在训练深度神经网络的时候，梯度变得过大而损失…”相关的问题

第1题

长短时记忆神经网络被设计用来解决什么问题（）。

A.传统RNN存在的梯度消失/爆炸问题

B.传统RNN计算量大的问题

C.传统RNN速度较慢的问题

D.传统RNN容易过过拟合的问题

点击查看答案

第2题

下列哪些项属于传统循环神经网络的性质（）。

A.上一时刻的网络状态信息将会作用于下一时刻的网络状态

B.并行处理序列中所有信息

C.容易梯度爆炸/消失

D.易于搭建

点击查看答案

第3题

下列关于RNN、LSTM、GRU说法正确的是（）。

A.RNN引入了循环的概念

B.LSTM可以防止梯度消失或者爆炸

C.GRU是LSTM的变体

D.RNN、LSTM、GRU是同一神经网络的不同说法，没有区别

点击查看答案

第4题

有关深度神经网络的训练（Training）和推断（Inference），以下说法中不正确的是：（）。

A.将数据分组部署在不同GPU上进行训练能提高深度神经网络的训练速度。

B.TensorFlow使用GPU训练好的模型，在执行推断任务时，也必须在GPU上运行。

C.将模型中的浮点数精度降低，例如使用float16代替float32，可以压缩训练好的模型的大小。

D.GPU所配置的显存的大小，对于在该GPU上训练的深度神经网络的复杂度、训练数据的批次规模等，都是一个无法忽视的影响因素

点击查看答案

第5题

在深度学习中，下列对于sigmoid函数的说法，错误的是（）。

A.存在梯度爆炸的问题

B.不是关于原点对称

C.计算exp比较耗时

D.存在梯度消失的问题

点击查看答案

第6题

假设拥有一个已完成训练的、用来解决车辆检测问题的深度神经网络模型，训练所用的数据集由汽车和卡车的照片构成，而训练目标是检测出每种车辆的名称（车辆共有10种类型）。现在想要使用这个模型来解决另外一个问题，问题数据集中仅包含一种车（福特野马）而目标变为定位车辆在照片中的位置（）。

A.除去神经网络中的最后一层，冻结所有层然后重新训练

B.对神经网络中的最后几层进行微调，同时将最后一层（分类层）更改为回归层

C.使用新的数据集重新训练模型

D.所有答案均不对

点击查看答案

第7题

假设我们拥有一个已完成训练的、用来解决车辆检测问题的深度神经网络模型，训练所用的数据集由汽车和卡车的照片构成，而训练目标是检测出每种车辆的名称（车辆共有10种类型）。现在想要使用这个模型来解决另外一个问题，问题数据集中仅包含一种车（福特野马）而目标变为定位车辆在照片中的位置（）。

A.除去神经网络中的最后一层，冻结所有层然后重新训练

B.对神经网络中的最后几层进行微调，同时将最后一层（分类层）更改为回归层

C.使用新的数据集重新训练模型

D.所有答案均不对

点击查看答案

第8题

下列哪一项在神经网络中引入了非线性（）。

A.随机梯度下降修

B.正线性单元（ReLU）

C.卷积函数

D.以上答案都不正确

点击查看答案

第9题

关于长短时神经网络的叙述中错误的是（）。

A.引用自循环思想

B.产生梯度长时间持续流动的路径

C.积累的时间尺度不可以因输入序列而改变

D.可应用于语音识别和机器翻译

点击查看答案

第10题

在构建一个神经网络时，batchsize通常会选择2的次方，比如256和512，这是为什么呢？（）

A.当内存使用最优时这可以方便神经网络并行化

B.当用偶数是梯度下降优化效果最好

C.这些原因都不对

D.当不用偶数时，损失值会很奇怪

点击查看答案

第11题

Sigmoid函数常被用作神经网络的激活函数，关于其说法正确的是（）。

A.取值范围是（0，1]

B.不可以用来做二分类

C.sigmoid函数为饱和型函数。当sigmoid函数输入的值趋于正无穷或负无穷时，梯度会趋近零，从而发生梯度弥散现象

D.Sigmoid函数不适用于自变量和Logistic概率是线性关系的情况

点击查看答案

违法和不良信息举报电话：400-118-7898

举报/反馈/投诉邮箱：deng＃ujigu.com（请将＃替换成@）