2023年6月28日发(作者:)
绪论单元测试
1. 下列对大数据的特点描述不正确的是( )
A:速度要求快
B:数据类型多样
C:数据体量巨大
D:价值密度高
答案:D
第一章测试
1. 云主机和物理机的寿命都是永久性的。( )
A:对
B:错
答案:B
2. 对于实时性要求高的应用,需要应用实时处理架构。( )
A:对
B:错
答案:A
3. 数据仓库是用来存储数据的而不是分析数据的。( )
A:错
B:对
答案:A
4. 在DWS层中,用户行为日志数据分为公共字段和事件字段。(A:错
B:对
答案:B
5. 项目实施流程中没有哪一步( )
A:数据仓库设计开发
B:数据导出
C:下载数据
D:数据访问
答案:C
6. 数据分析在企业中的作用( )
A:帮助企业经营者平衡企业的收益
B:直接的获取经营的利润
C:干预经营者的决策
D:帮助企业经营者减少投入
答案:B
7. 数据结构中哪项不是页面入口的来源( )
A:push
B:应用首页
) C:登录页
D:详情页
答案:C
8. Hadoop的三大发行版本是 ( )
A:HDP
B:Java
C:CDH
D:Apache
答案:ACD
9. 流量分析常见指标有哪些方面 ( )
A:转化路径分析
B:来源分析
C:访客分析
D:受访分析
答案:ABCD
10. 网站流量数据分析的意义有哪些 ( )
A:帮助提高网站流量
B:帮助网站运营人员获取网站流量信息
C:提升网站用户体验
D:从多方面提供网站分析的数据依据
答案:ABCD
第二章测试
1. Hadoop是一种分布式系统基础架构,主要解决海量数据存储和海量数据计算两大问题。( )
A:对
B:错
答案:A
2. 在HDFS配置文件中,主要配置的就是配置文件。( )
A:对
B:错
答案:A
3. 在Hadoop分布式集群中,不需要对集群中的每一个节点都进行ip规划。( )
A:错
B:对
答案:A
4. 利用HDFS操作命令可以将数据文件从本地上传到HDFS上,也可以将数据文件从HDFS下载到本地。( )
A:对 5.
6.
7.
8.
9.
10.
11.
B:错
答案:A
在HDFS API操作中, closeFileSystem方法的功能是释放文件系统对象的资源。( )
A:对
B:错
答案:A
MapReduce词频统计案例中,执行map任务的最后阶段,会将缓冲区的数据全部写入到磁盘。( )
A:对
B:错
答案:A
Flume是Cloudera公司提供的一款高可用、高可靠、分布式的系统,可用于海量日志采集、聚合和传输。( )
A:对
B:错
答案:A
能在网络中安全传输文件的软件是( )。
A:Xftp
B:Xshell
C:VMware
D:IDEA
答案:A
创建了bigdata用户的命令是( )。
A:bigdata ALL
B:useradd bigdata
C:Sudoers
D:su bigdata
答案:B
论文( ),主要论证的核心是如何采用分布式的架构对海量数据进行分布式计算。
A:HDFS
B:MapReduce
C:BigTable
D:GFS
答案:B
假如我们设定HDFS块的大小是128M,那么,一个大小为500M的数据文件,将会被拆分成( )个分片
A:2
B:5
C:4 12.
13.
14.
15.
16.
17.
18.
D:3
答案:C
在Linux命令行中,使用( )命令格式化hive元数据库
A:del
B:clear
C:format
D:schematool
答案:D
在Hive中给表添加数据,使用( )方式给表添加数据效率更高。
A:append
B:Add
C:insert into
D:Load
答案:D
关系型数据库与HDFS之间相互数据迁移的工具是( )。
A:fastcopy
B:sqoop
C:fsck
D:distcp
答案:B
Notepad++功能有( )。
A:编写计算机程序代码
B:可以连接虚拟机,对虚拟机中的文件进行编辑。
C:制作一般的纯文字说明文件
D:语法高亮度显示、语法折叠功能、支持宏、扩充基本功能的外挂模组
答案:ABCD
Hadoop主要包含( )三大功能组件。
A:HDFS
B:Hadoop
C:MapReduce
D:YARN
答案:ACD
Hadoop具有( )优势。
A:高容错性
B:高效性
C:高扩展性
D:高可靠性
答案:ABCD
下面说法正确的是( )。
A:Java编程的核心就是JVM,JVM是JRE的一部分,它是一个虚拟出来的计算机。
B:JDK包含JRE和JVM 19.
20.
21.
22.
23.
24.
C:JRE是java运行时的类库
D:JDK是Java语言的开发环境
答案:ABCD
在分布式文件系统HDFS当中提供了两种操作命令,是( )。
A:hdfs dfs
B:Hadoop dfs
C:hdfs fs
D:hadoop fs
答案:AD
Hive是基于Hadoop技术的数据仓库工具,用来对数据进行( )。
A:提取
B:转化
C:加载
D:分析
答案:ABCD
使用beeline客户端远程访问Hive之前,需要启动的两个服务是( )。
A:hive –service metastore
B:hive –service hiveserver
C:hive –server metastore
D:hive –service hiveserver2
答案:CD
Hive的复杂数据类型有( )三种
A:STRUCT
B:ARRAY
C:Char
D:MAP
答案:ABD
成功安装Zookeeper集群后,查看各节点的角色信息时,会看到1个、多个( )。
A:zookeeper
B:leader
C:follower
D:zkServer
答案:BC
Kafka是一种高吞吐量的分布式发布订阅消息系统,是Apache基金会开源的消息队列,该框架由( )编写而成。
A:Java
B:C++
C:Scala
D:Python
答案:AC 第三章测试
1. 业务字段指的是每个移动端固定的、共有的字段;公共字段代表的是用户在app中执行过的所有操作。( )
A:对
B:错
答案:B
2. 在Flume过程中,Flume对接本地磁盘文件,通过tailDir类型实时监控当前数据文件中数据内容的变化。( )
A:错
B:对
答案:B
3. ETL 拦截器主要用于过滤时间戳不合法和 json 数据不完整的日志。( )
A:对
B:错
答案:A
4. Flume分流标记拦截器主要是用于区分启动日志和事件日志。( )
A:对
B:错
答案:A
5. 以下关于Flume的说法正确的是____。( )
A:Sink是Flume数据传输的基本单元
B:Source是Flume数据传输的基本单元
C:Channel是Flume数据传输的基本单元
D:Event是Flume数据传输的基本单元
答案:D
6. Flume通过内部的采集数据传输机制进行快速的数据传输,传输完之后会将数据就存储到____中。( )
A:Source
B:Channel
C:Kafka
D:HDFS
答案:C
7. 可以使用____命令,启动Kafka的一个消费者。( )。
A:
B:
C:
D:
答案:A
8. 在Flume消费的整体流程中,第一部分是别名配置,在别名配置的过程当中,配置了两个数据流用来处理( )。
A:启动日志数据和事件日志数据 B:Flume环境变量
C:Flume数据消费脚本
D:ETL和分流标记拦截器
答案:A
9. 在Flume数据传输的过程中,当source将数据传递给channel时,数据会先后经过( )两个拦截器。
A:Flume分流标记拦截器
B:时间戳拦截器
C:UUID拦截器
D:ETL 拦截器
答案:AD
10. Flume的安装与部署可以分为下列哪三个步骤( )。
A:将Flume安装包上传至Linux操作系统
B:解压到指定目录,进行环境变量的配置
C:在Flume的配置文件中修改指定配置
D:启动Flume数据消费脚本
答案:ABC
第四章测试
1. 在数据仓库中,ODS层的作用是保持数据原貌,不做任何修改,起到备份数据的作用( )
A:对
B:错
答案:A
2. 在数据仓库中,DWD层的作用是对数据进行清洗( )
A:对
B:错
答案:A
3. 在ADS层中,通过在启动日志中统计不同设备ID出现的次数来分析用户活跃?( )
A:错
B:对
答案:B
4. 在ADS层中,按照设备ID对日活表分组,登录次数为1,且在一周前登录的这种分析方式,分析沉默用户?( )
A:错
B:对
答案:B
5. DWS层统计各个主题对象的当天行为,服务于DWT层的主题宽表。DWS层的宽表字段,是站在不同维度的角度去看事实表,重点关注事实表的度量值,通过与之关联的事实表,获得不同的事实表的度量值( ) 6.
7.
8.
9.
10.
A:对
B:错
答案:A
在数据仓库项目中,我们在DWD层使用( )手段清洗数据
A:Python
B:Kettle
C:SQL
D:RDD
答案:C
在数据仓库中,用于数据清洗的是哪个层( )
A:DWS
B:DWD
C:DWT
D:ODS
答案:B
数据仓库一般分为( )
A:DWD
B:DWS
C:DWT
D:ODS
E:ADS
答案:ABCDE
在数据仓库DWD层中,需要清洗哪些数据( )
A:将用户行为宽表和业务表进行数据一致处理
B:创建分区表
C:空值的去除
D:过滤核心字段
答案:ACD
在数据仓库中,ODS层做了什么业务( )
A:创建分区表
B:保持数据原貌
C:空去除
D:采用LZO压缩
答案:ABD
第五章测试
1. MySQL中,用于创建数据库的命令是( )。
A:create table 数据库名;
B:create database 数据库名;
C:use 数据库名;
D:drop database 数据库名;
答案:B 2. 使用sqoop进行从Hive 到 MySQL数据库的数据迁移时,其命令为( )。
A:sqoop job
B:sqoop import
C:sqoop export
D:sqoop merge
答案:C
3. pyecharts中,柱状图类是( )。
A:Line
B:Bar
C:Pie
D:Liquid
答案:B
4. pyecharts中,饼图类是( )。
A:Bar
B:Line
C:Liquid
D:Pie
答案:D
5. 全局配置项可通过( )方法设置。
A:set_series_opts
B:add_yaxis
C:set_global_opts
D:reversal_axis
答案:C
6. 使用pyecharts工具绘图时,可直接进行图表的绘制, 无需在程序中导入对应的图表类。( )
A:对
B:错
答案:B
7. 使用pyecharts工具绘图时,可以通过设置初始化配置项中的图表 ID,设置图表的唯一标识,以此来区分多个图表。( )
A:错
B:对
答案:B
8. 饼图常用于表示不同分类的占比情况,通过弧度大小来对比各种分类。( )
A:对
B:错
答案:A
9. pyecharts中,全局配置项有( )。
A:标题配置项
B:图例配置项
C:坐标轴配置项 D:提示框配置项
答案:ABCD
10. pyecharts的标题配置项TitleOpts中,可进行的设置有( )。
A:副标题文本
B:主标题文本
C:标题位置
D:标题字体样式
答案:ABCD
发布者:admin,转转请注明出处:http://www.yc00.com/web/1687933071a58489.html
评论列表(0条)