大数据采集与存储智慧树知到答案章节测试2023年山东交通学院|江阴雨辰互联

2023年6月30日发(作者：)

第一章测试

1. 关系模式学生信息（学号，姓名，年龄，性别，籍贯），其中的主键是（）

A:性别

B:年龄

C:学号

D:姓名

答案:C

2. Oracle是一个开源、免费的中小型关系型数据库管理系统。（）

A:对

B:错

答案:B

3. NoSQL的全称是（）

A:其余选项都不是

B:Not Only Sql

C:No Sql

D:Not Sql

答案:B

4. 键值数据库，是基于key-value模式，它使用简单的键值方法来存储数据。（）

A:对

B:错

答案:A

5. （）是最原始的SQL On Hadoop的解决方案，它是基于Hadoop实现的分布式数据仓库。

A:ZooKeeper

B:Hbase

C:Hadoop

D:Hive

答案:D

6. 图数据库，以“图”数据结构存储和查询数据，使用节点表示数据模型中的实体，节点之间的边表示实体之间的关系。（）

A:对

B:错

答案:A

第二章测试

1. 关于数据模型，下列说法正确的是（）。

A:数据操作是对数据库静态特性的描述。

B:3种基本数据模型有图形模型、层次模型和关系模型

C:数据模型是对数据库动态特性的描述。 2.

D:数据模型的三要素是数据结构、数据操作和数据完整性约束

答案:D

关于学生关系，下列哪一个属性适合作为候选码（）。

A:班级

B:学号。

C:性别

D:年龄。

答案:B

有学生表Student(S# char(8), Sname char(10), Ssex char(2), Sage integer, D#

char(2), Sclass char(6))。要检索学生表中“所有年龄小于等于19岁的学生的年龄及姓名”，SQL语句正确的是（）

A:Select * From Student Where Sage ＜= 19

B:Select Sname From Student Where Sage ＜= 19

C:Select Sage, Sname From Student Where Sage ＜= 19

D:Select Sage, Sname From Student

答案:C

有学生表Student(S# char(8), Sname char(10), Ssex char(2),Sage integer, D#

char(2), Sclass char(6))。若要“检索名字为姓张的所有同学姓名”，SQL语句正确的是（）

A:Select Sname From Student Where Sname Like ‘张%’

B:Select Sname From Student Where Sname Like ‘张_’

C:Select Sname From Student Where Sname Like ’张_ ’

D:Select Sname From Student Where Sname Not Like ’张 _’

答案:A

SQL语言中，删除一个表的命令是（）

A:DROP

B:CLEAR

C:REMOVE

D:DELETE

答案:A

在下列关于视图的叙述中，正确的是（）

A:当某一视图删除后，由该视图导出的其它视图也将自动删除；

B:若导出某视图的基本表被删除，该视图将不受任何影响；

C:视图—旦建立，就不能被删除；

D:当修改某一视图时，导出该视图的基本表也随之修改。

答案:D

查询时，若要输出无重复的记录，SELECT子句中使用的保留字是：（）

A:TOP N

B:ALL

C:TOP N PERCENT D:DISTINCT

答案:D

8. 查询结果输出时要求按“总评成绩”降序排列，相同者按“性别”升序，正确的子句是（）

A:ORDER BY 总评成绩 ASC,性别 DESC

B:ORDER BY 总评成绩 DESC,性别 DESC

C:ORDER BY 总评成绩,性别 DESC

D:ORDER BY 总评成绩 DESC,性别

答案:D

9. 参照完整性规则是指表的（）必须是另一个表主键的有效值，或者是空值。

A:主键

B:外键

C:候选键

D:主属性

答案:B

10. 下面有关HAVING子句，说法不正确的是（）

A:使用HAVING子句的同时不能使用WHERE子句

B:使用HAVING子句的同时可以使用WHERE子句

C:使用HAVING子句的作用是过滤掉不满足条件的分组

D:HAVING子句必须与GROUP BY 子句同时使用，不能单独使用

答案:A

第三章测试

1. MongoDB是一个开源、高性能、无模式的文档型数据库。（）

A:对

B:错

答案:A

2. MongoDB通过（）来描述和存放数据。

A:BSON

B:JSON

C:XML

答案:A

3. 查看当前正在使用的数据库命令（）

A:db

B:use

C:get

D:set

答案:A

4. 查找kate同学的专业，使用指令（）完成。

答案:A 5. MongoDB中，用户可以将_id字段上的索引删除。（）

A:对

B:错

答案:B

6. 关系型数据库遵循BASE和CAP理论。（）

A:错

B:对

答案:A

第四章测试

1. 大数据采集，又称大数据获取，是指从（）等获取数据的过程。

A:传感器

B:企业系统

C:其它智能设备

D:社交网络

答案:ABCD

2. 网络爬虫的步骤是1）选取一部分种子URL；2）从待抓取URL队列中取出待抓取的URL，解析DNS，得到主机的IP地址，并将URL对应的网页下载下来，存储到已下载网页库中。此外，将这些URL放进已抓取URL队列；3）将这些URL放到待抓取URL中；4）分析已抓取URL队列中的URL，分析其中的其他URL，并且将这些URL放入待抓取URL队列，从而进入下一个循环。（）

A:2）4）1）3）

B:1）3）2）4）

C:2）3）4）1）

D:1）2）3）4）

答案:B

3. 数据完整性指的是数据具有一个实体描述的所有必需的部分。（）

A:对

B:错

答案:A

4. 在大数据预处理中，需要数据清洗的主要类型包括以下几类（）

A:异常值数据

B:重复值数据

C:需要标准化的数据

D:缺失值数据

答案:ABD

5. 数据清洗时重复值数据不能够删除。（）

A:对

B:错

答案:B 6. 在数据离散化中，常见的离散化方法有（）

A:基于卡方分箱的方法

B:基于熵的离散化

C:等频划分

D:聚类划分

E:等宽划分

答案:ABCDE

第五章测试

1. 爬虫就是能够实现网页数据爬取的程序。（）

A:错

B:对

答案:B

2. Python中提供的requests 库的get()方法能够实现爬取网页信息的功能。（）

A:错

B:对

答案:B

3. 在使用requests库获取网页资源过程中，最重要的两个对象就是Request和Response，（）负责将客户端的请求发送给服务器。

A:Response

B:Request

答案:B

4. HTML语言使用“标签对”来标记信息。其中，＜html＞ …… ＜/html＞标记一个HTML文件中标题的开始和结束。（）

A:对

B:错

答案:B

5. 以下程序段的运行结果是from bs4 import BeautifulSouphtmlText = ‘＜p＞解析页面＜/p＞’soup = BeautifulSoup(htmlText, ’’)print(soup.p)

（）

答案:B

6. 如果有网络爬虫频繁的访问服务器，则容易引发（）问题。

A:个人隐私问题

B:网站的性能下降

C:法律风险

答案:B

7. 任何网站都有自己的Robots协议，用来保护网站的信息不会被恶意访问。（）

A:对 B:错

答案:B

第六章测试

1. Kettle是一种常用的ETL工具，它支持图形化的GUI设计界面。（）

A:对

B:错

答案:A

2. 在数据清洗中，“输入”功能主要是实现ETL的数据抽取、加载、格式转换。（）

A:对

B:错

答案:B

3. Kettle能够支持多种格式的数据输出，但不支持下面（）文件格式。

A:excel

B:txt

C:word

D:json

E:MySql数据库

答案:C

4. kettle中的以下组件中，属于基本数据清洗的是（）

A:连接字段

B:数据替换

C:数据排序

D:删除数据

答案:ABCD

5. Kettle 让我们在可视化的界面中，通过拖拽实现数据处理。无需掌握复杂的编程技术也可以帮助我们完成数据的ETL处理。（）

A:对

B:错

答案:A

6. Kettle中的job作业是指定时完成一系列指定的数据转换，并将结果以邮件的方式告知给我们。（）

A:对

B:错

答案:A

第七章测试

1. 在本案例中，数据采集是通过（）获取。

A:传感器数据

B:网络爬虫 2.

C:企业管理系统

D:社交网络

答案:B

在数据采集后，python中使用（）库把数据存储到csv文件中。

A:pandas库

B:request库

C:mysql库

D:csv库

答案:D

3. 不同的关系型数据库管理系统，使用的SQL标准不一样。（A:对

B:错

答案:B

4. 开发者工具中Network标签包括（）

A:概要

B:请求列表

C:概览

D:过滤器

E:控制器

答案:ABCDE

5. 查找集合中的数据，使用（）方法。

A:get方法

B:query方法

C:find方法

D:select方法

答案:C

）

发布者：admin，转转请注明出处：http://www.yc00.com/news/1688109139a82843.html

大数据采集与存储智慧树知到答案章节测试2023年山东交通学院

发表回复

评论列表（0条）

联系我们

400-800-8888

大数据采集与存储智慧树知到答案章节测试2023年山东交通学院

相关推荐

发表回复

评论列表（0条）

联系我们

400-800-8888