首页 > 其他

题目内容（请给出正确答案）

[单选题]

将两篇文本通过词袋模型变为向量模型，通过计算向量的（）来计算两个文本间的相似度。

A.正弦距离

B.余弦距离

C.长度

D.方向

查看答案

如果结果不匹配，请联系老师获取答案

您可能会需要：

重置密码查看订单联系客服

安装优题宝APP，拍照搜题省时又省心！

更多“将两篇文本通过词袋模型变为向量模型，通过计算向量的（）来计算…”相关的问题

第1题

词袋模型最重要的是构造词表，然后通过文本为词表中的词赋值，但词袋模型严重缺乏相似词之间的表达。（）

点击查看答案

第2题

下列关于文本分类的说法不正确的是（）。

A.文本分类是指按照预先定义的主题类别，由计算机自动地为文档集合中的每个文档确定一个类别

B.文本分类大致可分为基于知识工程的分类系统和基于机器学习的分类系统

C.文本的向量形式一般基于词袋模型构建，该模型考虑了文本词语的行文顺序

D.构建文本的向量形式可以归结为文本的特征选择与特征权重计算两个步骤

点击查看答案

第3题

以下属于考虑词语位置关系的模型有（）。

A.词向量模型

B.词袋模型

C.词的分布式表示

D.TF-IDF

点击查看答案

第4题

在词袋模型中使用单个的单词来构建词向量这样的序列被称为（）。

A.1元组（1-gram））

B.单元组（unigram）模型

C.列表

D.字典

点击查看答案

第5题

词袋模型、TF-ID

A.word2vec等模型都有着同样的作用是（）。

B.文本情感分析

C.文本特征向量化

D.文本特征离散化

E.文本特征分布式

点击查看答案

第6题

向量空间模型的缺陷不包括（）。

A.维度灾难

B.模型稀疏性

C.语义信息缺失

D.无法计算文本相似度

点击查看答案

第7题

下列关于词袋模型说法正确的是（）。

A.词袋模型可以忽略每个词出现的顺序

B.词袋模型不可以忽略每个词出现的顺序

C.TensorFlow支持词袋模型

D.词袋模型可以表出单词之间的前后关系

点击查看答案

第8题

下面属于词袋模型的缺点的是（）。

A.词汇表的词汇需要经过精心设计

B.表示具有稀疏性

C.丢失词序忽略了上下文

D.模型复杂，不利于实施；

点击查看答案

第9题

下列关于自然语言处理中的关键词提取的说法正确的是（）。

A.关键词提取是指用人工方法提取文章关键词的方法

B.TF-IDF模型是关键词提取的经典方法

C.文本中出现次数最多的词最能代表文本的主题

D.这个问题设计数据挖掘，文本处理，信息检索等领域

点击查看答案

第10题

资本资产定价模型通过投资组合将系统风险分散掉，只剩下非系统风险。()

点击查看答案

第11题

下列核函数特性描述错误的是（）。

A.只要一个对称函数所对应的核矩阵半正定，就能称为核函数；

B.核函数选择作为支持向量机的最大变数；

C.核函数将影响支持向量机的性能；

D.核函数是一种降维模型；

点击查看答案

违法和不良信息举报电话：400-118-7898

举报/反馈/投诉邮箱：deng＃ujigu.com（请将＃替换成@）