大数据创新实践考试
返回上一级
单选题(共30题,每题2分)
1 . 下面有关分类算法的准确率,召回率,F1 值的描述,错误的是: A.
准确率是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率
B.
召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是
检索系统的查全率
C.
正确率、召回率和 F 值取值都在0和1之间,数值越接近0,查准率或查全率就越高
D.
为了解决准确率和召回率冲突问题,引入了F1分数
我的答案: B 参:C
答案解析: 正确率、召回率和 F 值取值都在0和1之间,数值越接近0,查准率或查全率就越高
2 . 下列关于普查的缺点的说法中,正确的是:
A.
工作量较大,容易导致调查内容有限、产生重复和遗漏现象
B.
误差不易被控制
C.
对样本的依赖比较强
D.
评测结果不够稳定
我的答案: A 参:A
答案解析: 工作量较大,容易导致调查内容有限、产生重复和遗漏现象 3 . 鸿蒙操作系统的开发者是: A. 微软公司
B.
百度公司
C.
华为公司
D.
阿里巴巴
我的答案: C 参:C
答案解析: 华为公司
4 . 推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于网站最热卖商品、客户所处城市、( ),推测客户将来可能的购买行为。
A. 客户的朋友
B.
客户过去的购买行为和购买记录
C.
客户的兴趣爱好
D.
客户的个人信息
我的答案: B 参:B
答案解析: 客户过去的购买行为和购买记录
5 . 2009年,甲型H1N1流感全球爆发,谷歌(5000万条记录数据,做了4.5亿不同数学模型)测算的结果与官方最后的数据相关性非常接近,达到了:
A. 77%
B. 97%
C. 67%
D. 87%
我的答案: B 参:B
答案解析: 97%
6 . 根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是:
A. 数据管理人员
B.
数据分析人员
C.
研究人员
D.
软件工程师
我的答案: C 参:C
答案解析: 研究人员
7 . 一切皆可试,大数据分析的效果好坏,可以通过模拟仿真或者实际运行来验证,这体现了大数据思维维度中的: A. 相关思维
B.
因果思维
C.
定量思维
D.
实验思维
我的答案: D 参:D
答案解析: 实验思维 8 . Hadoop的作者是: A. Martin Fowler
B.
Kent Beck
C.
Doug cutting
D.
BILL
我的答案: C 参:C
答案解析: Doug cutting 9 . ENIAC诞生于哪一年:
A. 1946年
B.
1938年
C.
1940年
D.
1942年
我的答案: A 参:A
答案解析: 1946年
10 . 大数据环境下的隐私担忧,主要表现为: A.
个人信息的被识别与暴露
B.
用户画像的生成
C.
恶意广告的推送
D.
病毒入侵
我的答案: A 参:A
答案解析: 个人信息的被识别与暴露
11 . 当今时代步入了一个信息化助力社会全方位创新的重要时期,具体包括: A. 云计算
B.
物联网
C.
移动互联和人工智能
D.
以上都是
我的答案: D 参:D
答案解析: 以上都是
12 . 人类的思维模式不包括哪一种: A. 逻辑思维
B.
直观思维 C. 胡乱思维
D.
顿悟思维
我的答案: C 参:C
答案解析: 胡乱思维
13 . 数据、信息、知识三者之间的变化趋势是:
A.
价值递减
B.
价值递增
C.
价值先增后减
D.
价值不变
我的答案: B 参:B
答案解析: 价值递增
14 . 云计算分层架构不包括:
A. IaaS
B. PaaS
C. SaaS
D. YaaS
我的答案: D 参:D
答案解析: YaaS
15 . 以下说法错误的是: A.
计算就是物理计算
B.
数据的内涵发生变化
C.
搜索就是计算
D.
计算的内涵发生了变化
我的答案: A 参:A
答案解析: 计算就是物理计算 16 . 以下几种模型方法属于判别式模型(Discriminative Model)的有( ) 1)混合高斯模型2)条件随机场模型 3)区分度训练4)隐马尔科夫模型:
A. 2,3
B. 1,4
C. 2,4
D. 1,3
我的答案: A 参:A
答案解析: 2,3
17 . 数据清洗的方法不包括: A. 噪声数据清除
B.
一致性检查
C.
重复数据记录处理
D.
缺失值处理
我的答案: C 参:C
答案解析: 重复数据记录处理
18 . 人类利用信息的历史,经历了( )次,促生了数据大爆炸。
A. 三
B. 四
C. 五
D. 六
我的答案: C 参:D
答案解析: 六
19 . 下列说法错误的是:
A.
大数据是一种思维
B.
大数据不仅仅是数据的体量大
C.
大数据的英文是large data
D.
大数据会带来机器智能
我的答案: C 参:C
答案解析: 大数据的英文是large data 20 . 万维网之父是: A. 彼得·德鲁克
B.
杨振宁
C.
蒂姆·伯纳斯-李
D.
钱学森
我的答案: C 参:C
答案解析: 蒂姆·伯纳斯-李
21 . 阿兰图灵是在哪一年提出图灵测试的: A. 1950年
B.
1952年
C.
1954年
D. 1955年
我的答案: A 参:A
答案解析: 1950年
22 . 大数据的利用过程是: A.
采集-挖掘-清洗-统计
B.
采集-统计-清洗-挖掘
C.
采集-清洗-挖掘-统
D.
采集-清洗-统计-挖掘
我的答案: D 参:D
答案解析: 采集-清洗-统计-挖掘 23 . 信息时代的三大定律不包括:
A.
牛顿定理
B.
摩尔定律
C.
麦特卡尔夫定律
D.
吉尔德定律
我的答案: A 参:A
答案解析: 牛顿定理
24 . 噪声数据的产生原因主要有: A. 采集设备有问题
B.
数据录入过程中产生错误
C.
数据传输过程出现错误
D. 以上都有
我的答案: D 参:D
答案解析: 以上都有
25 . 下列关于大数据的分析理念的说法中,错误的是: A.
在数据基础上倾向于全体数据而不是抽样数据
B.
在分析方法上更注重相关分析而不是因果分析
C.
在分析效果上更追究效率而不是绝对精确
D.
在数据规模上强调相对数据而不是绝对数据
我的答案: D 参:D
答案解析: 在数据规模上强调相对数据而不是绝对数据 26 . 互联网新生业态中新兴经济形态包括:
A. 网红经济
B. 平台经济
C.
粉丝经济
D.
生态经济
我的答案: B 参:B
答案解析: 平台经济
27 . 新媒体采用的技术不包括: A. 数字技术
B.
网络技术
C.
移动通信技术
D.
碎片技术
我的答案: D 参:D
答案解析: 碎片技术
28 . HDFS中的block默认保存几份:
A. 3份
B. 2份
C. 1份 D. 不确定
我的答案: A 参:A
答案解析: 3份
29 . 数据的精细化程度是指( ),越细化的数据,价值越高。
A. 规模
B. 活性
C. 颗粒度
D.
关联性
我的答案: C 参:C
答案解析: 颗粒度
30 . 下列关于舍恩伯格对大数据特点的说法中,错误的是: A. 数据规模大
B.
数据类型多
C.
处理速度快
D.
价值密度高
我的答案: D 参:D 答案解析: 价值密度高 多选题(共10题,每题 3分) 1 . 虚拟化技术在以下哪些方面发挥关键作用: A. 服务器虚拟化
B.
存储虚拟化
C.
网络虚拟化
D.
桌面虚拟化
我的答案: ABCD 参:ABCD
答案解析: 服务器虚拟化、存储虚拟化、网络虚拟化、桌面虚拟化 2 . 人工智能包括( )等主要技术。 A. 语音识别
B.
图像识别
C.
自然语言处理
D.
大数据分析
我的答案: ABCD 参:ABCD
答案解析: 语音识别、图像识别、自然语言处理、大数据分析 3 . 按照涉及自变量的多少,可以将回归分析分为: A. 线性回归分析
B.
非线性回归分析 C. 一元回归分析
D.
多元回归分析
我的答案: CD 参:CD
答案解析: 一元回归分析、多元回归分析 4 . 服务器虚拟化实现方式分为以下( )种。
A.
CPU虚拟化
B.
内存虚拟化
C.
I/O虚拟化
D.
显示器虚拟化
我的答案: ABC 参:ABC
答案解析: CPU虚拟化、内存虚拟化、I/O虚拟化
5 . 传统数据密集型行业积极探索和布局大数据应用的表现为: A.
自行开发数据产品
B.
实现科学决策与运营
C.
打通多源跨域数据
D.
提高分析挖掘能力
我的答案: BCD 参:BCD
答案解析: 实现科学决策与运营、打通多源跨域数据、提高分析挖掘能力 6 . 云化的好处有以下哪些: A. 资源可全局调度
B.
架构可灵活调整的能力
C.
能力可全面开放
D.
容量可弹性伸缩
我的答案: ABCD 参:ABCD
答案解析: 资源可全局调度、架构可灵活调整的能力、能力可全面开放 、容量可弹性伸缩
7 . 信息社会经历的发展阶段包括以下:
A.
计算机时代
B.
互联网时代
C.
云计算时代
D.
大数据时代
我的答案: ABD 参:BD
答案解析: 互联网时代、大数据时代 8 . 云存储分为( )层。 A. 存储层
B.
基础管理层
C.
应用层
D.
访问层
我的答案: ABCD 参:ABCD
答案解析: 存储层、基础管理层、应用层、访问层 9 . 云计算网络架构包括: A. 存储域
B.
计算域
C.
交换域
D.
管理域
E.
核心域
我的答案: ABCD 参:ABCD
答案解析: 存储域、计算域、交换域、管理域 10 . 网络虚拟化实现方式分为以下( )种。 A. 核心层虚拟化
B.
接入层虚拟化
C.
虚拟机网络虚拟化
D.
管理层虚拟化
我的答案: ABC 参:ABC
答案解析: 核心层虚拟化、接入层虚拟化、虚拟机网络虚拟化
判断题(共10题,每题 1分)
1 . Hadoop的HDFS是一种分布式文件系统,适合高容错、高吞吐量场景的数据存储和管理。 对 错
我的答案: 对
参:对
答案解析: Hadoop的HDFS是一种分布式文件系统,适合高容错、高吞吐量场景的数据存储和管理。
2 . 简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。 对 错
我的答案: 错
参:错
答案解析: 错误
3 . 信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。 对 错
我的答案: 对
参:错
答案解析: 错误
4 . 对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。 对 错
我的答案: 错
参:错
答案解析: 错误
5 . 大数据时代无处不在主要包括:计算无处不在、软件无处不在、网络无处不在、大数据无处不在及服务无处不在。 对 错
我的答案: 对
参:对
答案解析: 大数据时代无处不在主要包括:计算无处不在、软件无处不在、网络无处不在、大数据无处不在及服务无处不在。 6 . 机器的智能方式和人是完全一样的。 对 错
我的答案: 错
参:错
答案解析: 错误
7 . 啤酒与尿布的经典案例,充分体现了实验思维在大数据分析理念中的重要性。
对 错
我的答案: 错
参:错
答案解析: 错误
8 . 大数据就是数据大,数据越多越好。 对 错
我的答案: 错
参:错
答案解析: 错误
9 . 关于数据生命周期管理的认识中,核心的是:数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段;在不同的数据存在阶段,数据的价值是不同的;根据数据价值的不同应该对数据采取不同的管理策略。 对 错
我的答案: 对
参:对
答案解析: 关于数据生命周期管理的认识中,核心的是:数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段;在不同的数据存在阶段,数据的价值是不同的;根据数据价值的不同应该对数据采取不同的管理策略。 10 . 关于计算机存储容量单位的描述:基本单位是字节。
参:对