2024年1月14日发(作者:)
3月6号---大数据测试题[第二次测试]
基本信息:[矩阵文本题] *
姓名:
部门:
员工编号:
________________________
________________________
________________________
1、vim退出不保存的命令是。()。 [单选题] *
A、:q
B、q
C、:wq
D、:q!(正确答案)
2、改变文件的属主的命令是。()。 [单选题] *
A、chmod
B、touch
C、chown(正确答案)
D、cat
3、Linux配置文件一般放在什么目录。()。 [单选题] *
A、etc(正确答案)
B、bin
C、lib
D、dev
4、如果执行命令,chmod 746 file、txt ,那么该文件的权限是()。A、rwxr—rw-(正确答案)
B、rw-r—r—
C、—xr—rwx
D、rwxr—r—
5、python中序列类型不包含那一个?()。 [单选题] *
A、字符串
B、列表
C、元祖
D、字典(正确答案)
6、python中那个数据类型不支持? ()。 [单选题] *
A、int
B、float
C、char(正确答案)
D、list
单选题] * [
7、python中,a=round(3、45),请计算出a的数值。()。 [单选题] *
A、4
B、3、4
C、4、0
D、3(正确答案)
8、python中,下面那个关键字用来声明一个函数。()。 [单选题] *
A、def(正确答案)
B、pass
C、function
D、class
9、python中,那一个不是函数的有点。()。 [单选题] *
A、减少代码重复
B、程序模块化
C、加快程序运行(正确答案)
D、提高阅读代码的效率
10、python中单行和多少注释分别是那一个?()。 [单选题] *
A、 //和""" """
B、 #和""" """(正确答案)
C、 # 和//
D、 //和 是html和js
11、 MapReduce编程模型,键值对 [单选题] *
A、WritableComparable(正确答案)
B、 Comparable java比较接口
C、 Writable
D、 LongWritable
12、HBase是分布式列式存储系统,记录按什么集中存放。()。 [单选题] *
A、 行
B、 行列
C、 列族(正确答案)
D、 不确定
13、下列不是元祖定义方式。()。格式不匹配 [单选题] *
A、{3}(正确答案)
B、{3,}
C、{3,2}
D {3,2,{1,2}}
14、 客户端首次查询HBase数据库时,首先需要从哪个表开始查找。()。 [单选题] *
A、 用户表
B、 –ROOT-(正确答案)
C、 信息表
D、 信息表
15、HDFS 中的 block 默认保存几个备份。()。 [单选题] *
A、 1 份
B、 2 份
C、 3 份(正确答案)
D、 4 份
16、 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?()。 [单选题] *
A、 数据预处理(正确答案)
B、 分类和预测
C、 频繁模式挖掘
D、 数据流挖掘
17、python中,那一个不是python语言特点。()。 [单选题] *
A、python面向对象
B、python编程有格式要求
C、python比java效率高(正确答案)
D、python是人工智能选择的语言。
18、关于 SecondaryNameNode 哪项是正确的()。 [单选题] *
A、 它是 NameNode 的热备
B、 它对内存没有要求
C、 它的目的是帮助 NameNode 合并编辑日志,减少 NameNode 启动时间(正确答案)
D、 SecondaryNameNode 应与 NameNode 部署到一个节点
19、Python不支持的数据类型有()。数据类型 [单选题] *
A、char(正确答案)
B、int
C、float
D、list
20、 建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?()。 [单选题] *
A、 建模描述
B、 根据内容检索
C、 寻找模式和规则
D、 预测建模(正确答案)
21、 以下不是常用数据模型是那一个()。 [单选题] *
A、层次模型
B、网状模型
C、关系模型
D、树状模型(正确答案)
22.若一台计算机的内存为128MB,则交换分区的大小通常是()。 [单选题] *
A、64MB
B、128MB
C、256MB(正确答案)
D、512MB
23、什么是KDD()。 [单选题] *
A、 数据挖掘与知识发现(正确答案)
B、 领域知识发现
C、 文档知识发现
D、 动态知识发现
24、下列哪项不可以作为集群的管理A、Puppet
B、Pdsh
C、Cloudera Manager(正确答案)
D、Zookeeper
25、 以下哪一项属于非结构化数据。()。A、 数据库服务器日志数据
[单选题] *
[单选题] *
()。
B、 企业财务系统数据
C、 企业摄像头视频监控数据(正确答案)
D、 企业ERP数据
26、HDFS1、0 默认 Block Size大小是多少。()。 [单选题] *
A、 32MB
B、 64MB(正确答案)
C、 128MB
D、 256MB
27、 以下哪一项属于非结构化数据库()。 [单选题] *
A、 Mysql
B、 Oracle
C、 MongoDB(正确答案)
D、 SqlServer
28、下列哪个不是 Hadoop 运行的模式()。 [单选题] *
A、单机版
B、伪分布式
C、分布式
D、局域网模式(正确答案)
29、以下不属于数据挖掘方式的是()。 [单选题] *
A、 自然语言处理(正确答案)
B、 聚类
C、 分类
D、 关联规则
30、关于大数据的主要特征理解和描述不正确的有()。 [单选题] *
A、来源多,格式多
B、增长速度快,处理速度快(正确答案)
C、存储量大,计算量大
D、数据的价值密度较低
31、建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务()。 [单选题] *
A、 根据内容检索
B、 建模描述
C、 预测建模(正确答案)
D、 寻找模式和规则
32、在自然语言处理过程中,把句子拆分成一个个词语的过程被称为()。 [单选题]
*
A、分词(正确答案)
B、分解
C、切片
D、索引
33、文件权限读、写、执行三种符号的标志依次是()。 [单选题] *
A、rwx(正确答案)
B、xrw
C、rdx
D、rws
34、关于大数据的主要特征理解和描述不正确的有()。 [单选题] *
A、来源多,格式多
B、增长速度快,处理速度快(正确答案)
C、存储量大,计算量大
D、数据的价值密度较低
35、某文件的组外成员的权限是只读、属主是全部权限、组内权限是可读可写、该文件权限为()。 [单选题] *
A、467
B、674
C、476
D、764(正确答案)
36、什么命令常用于检测网络主机是否可达()。 [单选题] *
A、ssh
B、netstat
C、ping(正确答案)
D、exit
37、下列哪个不是 Hadoop 运行的模式()。 [单选题] *
A、单机版
B、伪分布式
C、分布式
D、局域网模式(正确答案)
38、Linux配置文件一般放在什么目录()。 [单选题] *
A、etc(正确答案)
B、bin
C、lib
D、dev
39、下列文件中,包含了主机名到IP地址映射关系的文件是()。A、/etc/hostname
B、/etc/hosts(正确答案)
C、/etc/
D、/etc/networks
40、下面哪个不是Python合法的标识符()。 [单选题] *
单选题] * [
A、__name__
B、40XL(正确答案)
C、self
D、int32
41、关于Python内存管理,下列说法错误的是()。 [单选题] *
A、可以使用del释放资源
B、变量不必事先声明
C、变量无须指定类型
D、变量无须先创建和赋值而直接使用(正确答案)
42、下列哪种说法是错误的()。 [单选题] *
A、除字典类型外,所有标准对象均可以用于布尔测试(正确答案)
B、空字符串的布尔值是False
C、空列表对象的布尔值是False
D、值为0的任何数字对象的布尔值是False
43、 python源程序执行的方式()。 [单选题] *
A 编译执行
B 直接执行
C 解析执行(正确答案)
D 边编译边执行
44、 计算机中信息处理和信息储存用()。 [单选题] *
A 二进制代码(正确答案)
B 十进制代码
C 十六进制代码
D ASCII代码
45、 Python语言语句块的标记是()。 [单选题] *
A 分号
B 缩进(正确答案)
C逗号
D 冒号
46、调用以下函数返回的值( )。
def myfun():
pass [单选题] *
A、 0
B、出错不能运行
C、 空字符串
D、None(正确答案)
47、 若不针对MapReduce编程模型中的key和value值进行特别设置,下列哪一项是MapReduce不适宜的运算()。 [单选题] *
A、 Max
B、 Min
C、 Count
D、 Average(正确答案)
48、下面哪个程序负责 HDFS 数据存储()。 [单选题] *
A、 Datanode(正确答案)
B、Jobtracker
C、 NameNode
D、 secondaryNameNode
49、HBase的Region组成中,必须要有以下哪一项()。A、 StoreFile
B、 MemStore(正确答案)
C、 HFile
D、 MetaStore
50、root用户的UID是 ()。 [单选题] *
A、0(正确答案)
B、1
C、1000
D、9999
单选题] * [
51、某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题()。 [单选题] *
A、 关联规则发现(正确答案)
B、 聚类
C、 分类
D、 自然语言处理
52、下面哪种不属于数据预处理的方法()。 [单选题] *
A、 变量代换
B、 离散化
C、 聚集
D、 估计遗漏值(正确答案)
53、数据仓库是随着时间变化的,下面的描述不正确的是()。 [单选题] *
A、 数据仓库随时间的变化不断增加新的数据内容;
B、 捕捉到的新数据会覆盖原来的快照;
C、 数据仓库随事件变化不断删去旧的数据内容;(正确答案)
D、 数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合、
54、下列哪项不可以作为集群的管理()。 [单选题] *
A、Puppet
B、Pdsh
C、Cloudera Manager(正确答案)
D、Zookeeper
55、以下不属于数据挖掘方式的是()。 [单选题] *
A、 自然语言处理(正确答案)
B、 聚类
C、 分类
D、 关联规则
56、在自然语言处理过程中,把句子拆分成一个个词语的过程被称为()。*
A、分词(正确答案)
B、分解
C、切片
D、索引
57、下列Python语句正确的是()。 [单选题] *
A、min = x if x
B、max = x > y ? x : y
C、if (x > y) print x
D、while True : pass(正确答案)
58、数据仓库是随着时间变化的,下面的描述不正确的是()。 [单选题] *[单选题]
A、数据仓库随时间的变化不断增加新的数据内容;
B、捕捉到的新数据会覆盖原来的快照;
C、数据仓库随事件变化不断删去旧的数据内容;(正确答案)
D、数据仓库中包含大量的综合数据,这些数据会随着时间变化不断地进行重新综合、
59、在Linux 下哪一个命令可以显示系统所有已经登录的用户 ()。 [单选题] *
A、find
B、ls
C、who(正确答案)
D、whereis
60、在linux的bash环境下普通用户的默认提示符是()。 [单选题] *
A、?
B、#
C、@
D、$(正确答案)
61关于 SecondaryNameNode 哪项是正确的()。 [单选题] *
A、它是 NameNode 的热备
B、它对内存没有要求
C、它的目的是帮助 NameNode 合并编辑日志,减少 NameNode 启动时间(正确答案)
D、SecondaryNameNode 应与 NameNode 部署到一个节点
62、下列不是元祖定义方式()。 [单选题] *
A、{3}(正确答案)
B、{3,}
C、{3,2}
D、{3,2,{1,2}}
63、有关数据仓库的开发特点,不正确的描述是: ()。 [单选题] *
A、 数据仓库开发要从数据出发;(正确答案)
B、 数据仓库使用的需求在开发出去就要明确;
C、 数据仓库的开发是一个不断循环的过程,是启发式的开发;
D、 在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式
64、下列关于Hadoop API 说法错误的是()。 [单选题] *
A、hadoop的文件API不是通用的,只用于HDFS文件系统(正确答案)
B、Configuration 类的默认实例化方法是以HDFS系统的资源配置为基础
C、FileStatus对象存储文件和目录的元数据
D、FSDataInputStream是java、io、DataInputStream的子类
65、在基于规则分类器的中,依据规则质量的某种度量对规则排序,
保证每一个测试记录都是由覆盖它的“最好的”规格来分类,这种方案称为()。
[单选题] *
A、基于类的排序方案
B、基于规则的排序方案(正确答案)
C、基于度量的排序方案
D、基于规格的排序方案。
66、下面关于数据粒度的描述不正确的是: ()。 [单选题] *
A、 粒度是指数据仓库小数据单元的详细程度和级别;
B、 数据越详细,粒度就越小,级别也就越高;
C、 数据综合度越高,粒度也就越大,级别也就越高;(正确答案)
D、 粒度的具体划分将直接影响数据仓库中的数据量以及查询质量、
67、HDfS 中的 block 默认保存几份()。 [单选题] *
A、3份(正确答案)
B、2份
C、1份
D、不确定
68、下面哪种不属于数据预处理的方法()。 [单选题] *
A、变量代换
B、离散化
C、聚集
D、估计遗漏值(正确答案)
69、下列哪项通常是集群的最主要瓶颈()。 [单选题] *
A、CPU
B、网络
C、磁盘IO(正确答案)
D、内存
70、MapReduce编程模型,键值对 [单选题] *
A、WritableComparable(正确答案)
B、Comparable
C、Writable
D、LongWritable
71、使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务()。 [单选题] *
A、 探索性数据分析(正确答案)
B、 建模描述
C、 预测建模
D、 寻找模式和规则
72、Linux中权限最大的帐户是:()。 [单选题] *
A admin
B root(正确答案)
C guest
D super
73、在基于规则分类器的中,依据规则质量的某种度量对规则排序,
保证每一个测试记录都是由覆盖它的“最好的”规格来分类,这种方案称为()。
[单选题] *
A、 基于类的排序方案
B、 基于规则的排序方案(正确答案)
C、 基于度量的排序方案
D、 基于规格的排序方案。
74、ls -a命令的作用是()。 [单选题] *
A 显示所有配置文件
B 显示所有文件,包含以、开头的文件(正确答案)
C 显示以、开头的文件
D 以a开头的文件
75、关于python类 说法错误的是()。 [单选题] *
A、类的实例方法必须创建对象后才可以调用
B、类的实例方法必须创建对象前才可以调用 不必创建也可调用(正确答案)
C、类的类方法可以用对象和类名来调用
D、类的静态属性可以用类名和对象来调用
76、以下哪项python能正常启动()。 [单选题] *
A、拼写错误
B、错误表达式
C、缩进错误
D、手动抛出异常(正确答案)
77、关于Hadoop单机模式和伪分布式的说法正确的是()。 [单选题] *
A、两者都启动守护进程,且守护进程运行在一台机器上
B、单机模式不使用HDFS,但加载守护进程
C、两者都不与守护进程交互,避免复杂性
D、后者比前者增加了HDFS输入输出以及可检查内存使用情况(正确答案)
78、下面哪个负责 HDFS 数据存储()。 [单选题] *
A、NameNode
B、ResourceManager
C、DataNode(正确答案)
D、NodeManager
79、有关数据仓库的开发特点,不正确的描述是:()。 [单选题] *
A、数据仓库开发要从数据出发;(正确答案)
B、数据仓库使用的需求在开发出去就要明确;
C、数据仓库的开发是一个不断循环的过程,是启发式的开发;
D、在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式
80、下面关于数据粒度的描述不正确的是:()。 [单选题] *
A、粒度是指数据仓库小数据单元的详细程度和级别;
B、数据越详细,粒度就越小,级别也就越高;
C、数据综合度越高,粒度也就越大,级别也就越高;(正确答案)
D、粒度的具体划分将直接影响数据仓库中的数据量以及查询质量、
81、使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务()。 [单选题] *
A、探索性数据分析(正确答案)
B、建模描述
C、预测建模
D、寻找模式和规则
82、为数据的总体分布建模多维空间划分成组等问题属于数据挖掘的哪一类任务?()。 [单选题] *
A、探索性数据分析
B、建模描述(正确答案)
C、预测建模
D、寻找模式和规则
83、python中,那一个不是函数的有点()。 [单选题] *
A、减少代码重复
B、程序模块化
C、加快程序运行(正确答案)
D、提高阅读代码的效率
84、以下哪一项属于非结构化数据()。 [单选题] *
A、数据库服务器日志数据
B、企业财务系统数据
C、企业摄像头视频监控数据(正确答案)
D、企业ERP数据
85、HBase是分布式列式存储系统,记录按什么集中存放()。 [单选题] *
A、行
B、行列
C、列族(正确答案)
D、不确定
86、某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题()。 [单选题] *
A、关联规则发现(正确答案)
B、聚类
C、分类
D、自然语言处理
87、什么是KDD()。 [单选题] *
A、数据挖掘与知识发现(正确答案)
B、领域知识发现
C、文档知识发现
D、动态知识发现
88、建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务()。概念 [单选题] *
A、根据内容检索
B、建模描述
C、预测建模(正确答案)
D、寻找模式和规则
89、用于自动补全功能时,输入命令或文件的前1个或后几个字母按什么键( B )。
[单选题] *
A、 ctrl 组合键
B、tab(正确答案)
C、alt 组合键
D、esc 退出
90、 Hadoop1、0默认的调度器策略是哪个()。 [单选题] *
A、 优先级调度器
B、 计算能力调度器
C、 公平调度器
D、 先进先出调度器(正确答案)
1、云计算核心就是本地无法解决的问题提交到计算机网络集群中运算,运用网络计算机的能力。 [判断题] *
对(正确答案)
错
2、分布式和集群都是解决大数据解决方案。 [判断题] *
对(正确答案)
错
3、Linux操作中,尽量少使用root用户登陆,减少风险。 [判断题] *
对(正确答案)
错
4、java和python都是面向对象的语言,都可以应用到大数据编程中。对(正确答案)
错
5、数据仓库随时间的变化不断增加新的数据内容。 [判断题] *
对(正确答案)
错
6、python中定义函数不用声明数据类型。 [判断题] *
对(正确答案)
判断题] * [
错
7、数据挖掘可以是很少的数据得到精确的结果,从而给出精准的决策。 [判断题]
*
对
错(正确答案)
8、海量数据可以存储到hadoop集群中通过map和reduce技术计算数据得出结果。 [判断题] *
对(正确答案)
错
9、搭建hadloop开发环境必须搭建集群否则无法使用。 [判断题] *
对
错(正确答案)
10、数据建模必须要有大量数据和数学算法才能得到结果,调整算法会影响最终的结果。 [判断题] *
对(正确答案)
错
11、Linux 系统安全性好,所以可以使用任意账号进行登陆。 [判断题] *
对
错(正确答案)
12、hadoop支持数据的随机读写。 [判断题] *
对
错(正确答案)
13、hadoop支持数据的随机读写。 [判断题] *
对
错(正确答案)
14、分布式和集群都是解决大数据解决方案。 [判断题] *
对(正确答案)
错
15、HDfS 中的 block 默认保存3分备份。 [判断题] *
对(正确答案)
错
16、云计算核心就是本地无法解决的问题提交到计算机网络集群中运算,运用网络计算机的能力。 [判断题] *
对(正确答案)
错
17、python中可以应用在大数据实时运算,java应用在大数据的推送。 [判断题] *
对
错(正确答案)
18、数据挖掘可以是很少的数据得到精确的结果,从而给出精准的决策。 [判断题]
*
对
错(正确答案)
19、python中可以应用在大数据实时运算,java应用在大数据的推送。 [判断题] *
对
错(正确答案)
20、数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合。 [判断题] *
对(正确答案)
错
21、Hadoop 默认调度器策略为 FIFO [判断题] *
对(正确答案)
错
22、网络爬虫可以爬取互联网上任意的网页。 [判断题] *
对
错(正确答案)
23、超市根据销售纪录发现,买啤酒的顾客有35%概率也会购买儿童尿布,这种属于数据挖掘的关联规则。 [判断题] *
对(正确答案)
错
24、磁盘是集群的最主要瓶颈,是否正确? [判断题] *
对(正确答案)
错
25、hadoop是java编写的,所以只支持对java编程语言。 [判断题] *
对
错(正确答案)
26、)网络爬虫可以爬取互联网上任意的网页。 [判断题] *
对
错(正确答案)
27、python中没有异常处理语句,必须使用if eles来解决。 [判断题] *
对
错(正确答案)
28、Hadoop 默认调度器策略为 FIFO [判断题] *
对(正确答案)
错
29、数据建模就是使用数学模型对大数据进行分析,解决现实生活中问题。题] *
对(正确答案)
判断 [
错
30、把句子拆分成一个个词语的过程被称为分词。 [判断题] *
对(正确答案)
错
发布者:admin,转转请注明出处:http://www.yc00.com/news/1705175461a1397200.html
评论列表(0条)