《大数据技术原理和应用操作》试卷B卷及答案

admin•2025-09-17 13:49:58•网站建设•阅读90

2024年1月5日发(作者：)

《大数据技术原理和应用操作》试卷B卷

一、单选题（每题2分，共计20分）

1. 在配置Linux网络参数时，固定IP地址是将路由协议配置为（）。

A、static

B、dynamic

C、immutable

D、variable

2.在MapReduce程序中，map()函数接收的数据格式是（）。

A、字符串

B、整型

C、Long

D、键值对

3.下列选项中，用于获取Zookeeper所包含的信息的Shell命令是（）。

A、ls

B、ls2

C、r

D、get

4.下列选项中，用于上传文件的Shell命令是（）。

A、-ls

B、-mv

C、-cp

D、-put

5.下列选项中，哪一项是可以进行重启引导系统（）。

A、OK

B、Cancel

C、Reboot

D、Apply

6.下列选项中，最早提出“大数据”这一概念的是（）。

A、贝恩

B、麦肯锡

C、吉拉德

D、杰弗逊

7.下列选项中，关于HDFS的架构说法正确的是（）。

A、HDFS采用的是主备架构

B、HDFS采用的是主从架构

C、HDFS采用的是从备架构

D、以上说法均错误

8.下列选项中，主要用于决定整个MapReduce程序性能高低的阶段是（）。

A、MapTask

B、ReduceTask

C、分片、格式化数据源

D、Shuffle

9.下列选项中，Hadoop2.x版本独有的进程是（）。

A、JobTracker

B、TaskTracker

C、NodeManager

D、NameNode

10.下列选项中，用于存放部署Hadoop集群服务器的是（）。

A、namenode

B、datanode

C、rack

D、metadata

二、多选题（每题2分，共计20分）

1.下列选项中，属于Google提出的处理大数据的技术手段有（）。

A、MapReduce

B、MySQL

C、BigTable

D、GFS

2.下列选项中，属于Hadoop版本系列的有（）。

A、Hadoop4

B、Hadoop2

C、Hadoop1

D、Hadoop3

3.下列选项中，属于Hadoop优势的有（）。

A、扩容能力强

B、可靠性

C、低效率

D、高容错性

4.下列哪项可以作为集群的管理？

A、Puppet

B、Pdsh

C、Cloudera Manager

D、Zookeeper

5.下列选项中，关于Hadoop集群说法正确的是（）。

A、Hadoop集群包含Worker节点

B、Hadoop集群包含Master节点

C、Hadoop集群包含Slave节点

D、Hadoop集群包含HMaster节点

6.下列说法中，关于crontab表达式说法正确的是（）。

A、通过执行crontab表达式可以执行定时任务

B、crontab表达式是由6个参数决定

C、Crontab表达式是由5个参数决定

D、以上说法均正确

7.在Zookeeper选举过程中，一共有四种状态，分别是（）。

A、竞选状态

B、随从状态

C、观察状态

D、领导者状态

8.下列说法中，关于使用Java API操作HDFS说法正确的是（）。

A、需要引入hadoop-common依赖

B、需要引入hadoop-hdfs依赖

C、需要引入hadoop-client依赖

D、以上说法均错误

9.下列选项中，属于Zookeeper集群的角色有（）。

A、Follower

B、Worker

C、Observer

D、Leader

10.下列选项中，属于Sqoop指令的参数有（）。

A、import

B、output

C、input

D、export

三、判断题（对的打“√”，错的打“×”；每题1分，共10分）

()函数会将map()函数输出的键值对作为输入，把相同key值的value进行汇总，输出新的键值对( )

per的选举机制，实际上是采用算法FastLeaderElection，投票数大于半数则胜出的机制。( )

组件是专门用来收集数据的，可以处理各种类型、各种格式的日志数据，包括avro、thrift、exec等。( )

CRT是一款支持SSH的终端仿真程序，它能够在Windows操作系统上远程连接Linux服务器执行操作。( )

5.大数据在医疗行业中可以有效控制疾病的发生。( )

6.传统文件系统存储数据时，若文件太大，会导致上传和下载非常耗时。( )

7.伪分布式模式下的Hadoop功能与完全分布式模式下的Hadoop功能相同。( )

8.由于Hadoop是使用Java语言编写的，因此可以使用Java API操作Hadoop文件系统。( )

HA是集群中启动两台或两台以上机器充当NameNode，避免一台NameNode节点发生故障导致整个集群不可用的情况。( )

目前不支持并发多用户的写操作，写操作只能在文件末尾追加数据。( )

四、填空题（每题2分，共计20分）

的核心是把数据从数据源通过数据采集器（Source）收集过来，再将收集的数据通过【】汇集到指定的接收器（Sink）。

发行版本分为开源社区版和【】。

3.数据仓库是面向【】、集成、【】和时变的数据集合，用于支持管理决策。

4.通过执行【】命令，查看该节点的Zookeeper角色。

是可以由【】组成，每个服务器机器存储文件系统数据的一部分。

6.如果使用Sqoop工具将MySQL表数据导入Hive数据仓库中，需要在配置文件中配置【】。

7.传统的文件系统对海量数据的处理方式是将数据文件直接存储在【】台服务器上。

8.【】是Zookeeper集群工作的核心，也是事务性请求（写操作）的唯一调度和处理者。

9.马云曾经说过未来的时代将不是IT时代，而是【】时代。

10.启动Hadoop集群，主要是启动其内部包含的【】和YARN集群。

五、简答题（每题6分，共计30分）

1.简述如何检查Namenode是否正常运行。

2.简述event。

3.启动Hive方式有哪些？

4.简述大数据在零售行业应用的具体表现。

5.简述Hive的排序种类及特点。

参考答案

单选题（每题2分，共计20分）

2. A

3. D

4. D

5. D

6. C

7. B

8. B

9. D

10. C

11. C

多选题（每题2分，共计20分）

1. A,C,D

2. B,C,D

3. A,B,D

4. A,B,D

5. B,C

6. A,B

7. A,B,C,D

8. A,B,C

9. A,C,D

10. A,D

判断题（每题1分，共计10分）

1. 对

2. 对

3. 对

4. 对

5. 错

6. 对

7. 错

8. 对

9. 对

10. 对

填空题（每题2分，共计20分）

1. 【缓冲通道（Channel）】

2. 【商业版】

3. 【主题】【非易实】

4. 【 status】

5. 【成百上千台服务器机器】

6. 【Hive的安装路径】

7. 【一】

8. 【Leader】

9. 【DT】

10. 【HDFS集群】

简答题（每题6分，共计30分）

1.正确答案：如果要检查Namenode是否正常工作，使用Jps命令即可。

2.正确答案：它是Flume内部数据传输的基本单元。一个完整的event包含headers和body，其中headers包含了一些标识信息，而body中就是Flume收集到的数据信息。

3.正确答案：/hive、/hiveserver2

4.正确答案：大数据在零售行业的具体表现有三个，分别是精准定位零售行业市场、支撑行业收益管理以及挖掘零售业新需求。

5.正确答案： by 全局排序

by 非全局排序

bute by hash散列分区，常和sort by同时使用。即分区又排序，需要设置s的个数

r by 当distribute by 和sort by的字段相同时，等同于cluster by.可以看做特殊的distribute + sort

发布者：admin，转转请注明出处：http://www.yc00.com/web/1704469534a1353311.html

数据集群操作每题选项

admin

网站建设
电脑硬盘分区不见了怎么恢复数据？方法来啦
电脑硬盘分区不见了怎么恢复数据？硬盘分区指的是在硬盘逻辑层面上划分出来的独立存储区域，一块硬盘可以根据用户的需要，划分成一个或多个分区，用来存放数据、安
admin
1月前
250
网站建设
SQL数据库置疑数据怎么恢复
甲驭数据恢复中心经过多年对主流数据库文件结构的研究，成功开发出赤兔数据库碎片恢复软件。可以从磁盘和分区恢复丢失的数据库文件与数据库备份文件，包括(mdf，ndf&#x
admin
1月前
210
网站建设
教大家如何自行快速恢复硬盘上的数据？
今天小编分享下前段时间小编遇到硬盘的问题，相信大家也遇到过这样的问题，就是硬盘上的数据被误删或者格式化的问题，一般我们可能会选择到外面花钱让人家给修复回来&#xff0
admin
1月前
230
网站建设
学习数据分析对笔记本电脑有什么要求呢？_数据分析笔记本电脑要求(1)
现在能在网上找到很多很多的学习资源，有免费的也有收费的，当我拿到1套比较全的学习资源之前，我并没着急去看第1节，我而是去审视这套资源是否值得学习&
admin
1月前
210
网站建设
AutoCAD 2018基础操作与技巧实战教程
本文还有配套的精品资源，点击获取简介：AutoCAD 2018是一款广泛应用于工程设计和建筑绘图的专业软件，提供二维制图和三维建模功能。本基础教程通过实例向初学者介绍
admin
1月前
200
网站建设
Windows基础操作（快捷键）
1.常用的快捷键Carl➕C复制Carl➕V粘贴Carl➕X剪切Carl➕Z撤销Carl➕N新建Carl➕S保存Carl➕O打开Carl➕W关闭标签页面Carl➕R刷新页面（浏览器）Carl➕T新
admin
1月前
140
网站建设
Vue大型表单数据导致el-input输入卡顿解决方案
Vue大型表单数据导致el-input输入卡顿解决方案说明在我们的日常开发中，可能会遇到一个大型的表单页面包含非常多个el-select及el-input组件的情况。如：对于这样大型
admin
1月前
290
网站建设
企业落地，达梦集群部署
Dm主备集群部署部署环境鲲鹏920-麒麟V10版本包dm-8.0.zip部署用户普通用户（需要root权限操作）部署方式集群注意事项该部署需要切换root用户
admin
1月前
250
网站建设
linux mysql 数据恢复_怎样恢复Mysql数据库误删除后的数据
导读在日常运维工作中，对于mysql数据库的权限的规避，SQL审核优化、数据备份恢复就变成了，工作必备技能；数据库对于网站的重要性使得我们对mysql数
admin
1月前
180
网站建设
苹果手机换机数据怎么导入新手机？4 种方法一步到位
上周给老妈买了新iPhone16，之前都是我帮她激活的，这次她没告诉我就自己操作了，激活后才发现数据还没导入，已错过‘快速开始’。这种情况下&#
admin
1月前
190
网站建设
【电子数据取证技术】第一章概述
电子数据取证技术第一章电子数据取证技术概述01 网络犯罪及其主要特点1.1 计算机犯罪与网络犯罪1.2 常见的网络犯罪形式1.3 网络犯罪的特点02 电子数据的概念2.1 电子证据与电子数据2.2 电子数据的常见类型2.3 现行法律对电子
admin
1月前
200
网站建设
平台经济的数据安全技术应用：如何应用数据安全技术？
文章标题平台经济的数据安全技术应用：如何应用数据安全技术？关键词：平台经济，数据安全，技术应用，身份认证，数据加密，隐私保护，风险评估摘要：随着平台经济的快速发展，数据安全成为不可忽视的重要议题。本文将探讨平台经济中数据安全技
admin
1月前
220
网站建设
android手机恢复微信图片,微信图片过期了怎么恢复？记住这个操作，找回更清晰！...
微信图片过期了怎么恢复？记住这个操作，找回更清晰！微信记录里的照片与日俱增，为了不使照片容易找并且看起来不那么乱，很多人会清理手机
admin
1月前
200
网站建设
TCGA数据下载教程：使用官方gdc-client软件下载
前言本教程涉及内容： TCGA网页数据下载，检索方式gdc-client软件安装和配置使用gdc-client下载TCGA数据 [补充] 怎么根据TCGA官方的API下载数据&#
admin
1月前
230
网站建设
两台电脑通过网线直连共享数据（超详细）
需要的材料：一根网线，两台电脑（有网口的电脑，台式或笔记本），我是win10系统。步骤&#xff1
admin
1月前
220
网站建设
python实现不登陆淘宝却获取到任意商品数据
文章目录一、前言二、需要导入的库三、页面分析四、代码五、结果展示六、Blogger’s speech一、前言 1、爬取内容均为在淘宝页面，用户能够浏览到的数据 2、用于交流学习，不会用于商用 3
admin
1月前
210
网站建设
使用redis分布式锁解决spring schedule集群部署重复执行问题
产品需求：对接腾讯云实时音视频，实时拉取腾讯云最新的视频并使用Ffmpeg视频合成。遇到问题：由于服务都是集群部署，定时任务会在各个服务器上重复执行，轻则浪费服务器资源，重则造成数据紊乱。解决方案： quartz定时任务提
admin
1月前
190
网站建设
Python3网络爬虫：腾讯新闻App的广告数据抓取
废话就不说了，咱们直接上代码def startGetData(self):index0while index < 3:indexindex1self.url"http:r.inews
admin
1月前
230
网站建设
Photoshop PS批处理操作教程（批量修改图片尺寸、参数等）
前言‌Photoshop批处理的主要作用‌是通过自动化处理一系列相似的操作来同时应用于多张图片，从而节省时间和精力，提高工作效率。批处理功能特别适用于需要批量处理的任务，如
admin
1月前
150
网站建设
【Photoshop JSX脚本】jsx如何操作excel
jsx需要借助js开源库来操作excel。github地址：SheetJS 可能你会奇怪这是这是浏览器JS操作excel，并不能用于Photoshop。你只要找到xlsx.extendscrip
admin
1月前
270

发表回复

评论列表（0条）

暂无评论

《大数据技术原理和应用操作》试卷B卷及答案

发表回复

评论列表（0条）

联系我们

400-800-8888

《大数据技术原理和应用操作》试卷B卷及答案

相关推荐

发表回复

评论列表（0条）

联系我们

400-800-8888