spark本地开发环境搭建

admin•2025-09-17 10:53:30•网站建设•阅读28

spark本地开发环境搭建

2024年5月4日发(作者：)

spark本地开发环境搭建

前提

1. CDH集群为6.0.1（hadoop对应版本为3.0.0）

安装scala

1. 配置环境变量SCALA_HOME和path

安装maven

安装比较简单，过程略。

安装winutils（windows才需要安装）

参考

idea安装scala插件

打开settings

安装scala插件

安装完成后重启idea

idea配置

打开Project Structure

添加scala Libraries

选择scala目录

idea 创建项目

创建maven项目

点击“Next”

输入项目信息

点击“Next”

完成

点击“Finish”即可

项目创建好以后，暂时删除test目录，把java文件夹修改为scala（这一步不是必

须，看个人爱好）

1. 创建文件，写入几行数据，上传到hdfs中

2. 把hadoop集群的配置文件和复制到项目的

resources目录下

经过测试，linux下运行idea，没有这两个文件也能连上hadoop集群

3. 创建scala代码

package hdfs import ession object HdfsTest { def mai

n(args: Array[String]): Unit = { // 如果在windows本地跑，需要从widnows访

问HDFS，需要指定一个合法的身份 // perty("HADOOP_USER_NAM

E", "hdfs") val spark = r( .appName("hdfs-test") .master

("local") // 设置参数 .config("me", "false") .g

etOrCreate(; // Level("DEBUG") //支持通配符路

径，支持压缩文件读取 val path = "hdfs://10.121.138.145:8020/" val rd

d = le(path) //统计数量 println("count = "+() //停

止spark ( } }

重点说明：

1. 如果在windows下运行，请添加

perty("HADOOP_USER_NAME", "hdfs")代码，否则会提示

Permission Denied

2. CDH默认me为true，意思为使用hostname

连接hdfs，如果我们不修改本机的host文件，本地是无法连接datanode

机器。有三种方式解决

• 修改本机的host，需要配置上所有的hadoop的host及ip

• 修改配置中的me为`false

• 代码中通过sparkSession设置.config("me",

"false") （推荐）

直接运行此代码即可，如果输出中的文本行数，恭喜你实验成功！

连接hive集群，没有找到类似mehive相关

的配置，所以只能通过hosts文件来解决。

第一步：修改本机hosts文件，配置hive集群的hostname及ip

修改本机hosts文件，让本机能够解析hive集群中的机器名及ip 比如我的配置：

10.121.138.145 lfg00 10.121.138.146 lfg01 10.121.138.147 lfg02 10.121.138.14

8 lfg03

第二步：连接hive

这步有两种方式：

1. 复制hive的配置文件至项目的resources文件夹下

2. 在代码中增加.config("","thrift://lfg00:9083")

第三步：代码

发布者：admin，转转请注明出处：http://www.yc00.com/web/1714820129a2522286.html

文件集群本机代码项目

admin

网站建设
通过网线构建局域网实现电脑共享文件
博主简介：原互联网大厂tencent员工，网安巨头Venustech员工，阿里云开发社区专家博主，微信公众号java基础笔记优质创作者，csdn优质创作博主，创业者，知识共享者,欢迎关注，点赞，收藏。目录一、背景二、两台电脑更改高级共
admin
1月前
200
网站建设
小项目开发——Android 音乐播放器
目录文章目录目录小项目开发——Android 音乐播放器一、题目二、实际最终效果三、模块分析四、思维导图五、Layout1. 自定义 Theme2. 导航栏 LOGO3. 音乐列表布局4. 音乐播放布局5. 设置APP图标及名字六、Act
admin
1月前
200
网站建设
【免费下载】推荐开源项目：M3UAndroid——您的全能流媒体播放器
推荐开源项目：M3UAndroid——您的全能流媒体播放器项目介绍M3UAndroid 是一款基于 Android 设备的免费流媒体播放器，完全采用 Jetpack Compose 构建&am
admin
1月前
180
网站建设
【免费下载】推荐开源项目：OPlayer - 强大的Android多媒体播放器
推荐开源项目：OPlayer - 强大的Android多媒体播放器 1、项目介绍 OPlayer 是一个专为Android平台设计的开源视频播放器，它利用了Vitamio的强大功能&#
admin
1月前
240
网站建设
转换PDF文件时为什么会出现异常？转换PDF文件时出现异常的解决方法介绍
在日常的学习和工作当中，经常会遇到PDF格式转换的需求，然而转换后文件出现异常这个问题也困扰了许多人，那么为什么会出现异常呢？应该如何解决呢&#
admin
1月前
320
网站建设
【亲测免费】《dify-schedule》项目安装与配置指南
《dify-schedule》项目安装与配置指南1. 项目基础介绍《dify-schedule》是一个开源项目，旨在提供一种简便的方式来调度和执行定时任务。该项目使用的主要编程语言是Python&#xff0
admin
1月前
220
网站建设
【亲测免费】 Dify-Schedule 开源项目使用教程
Dify-Schedule 开源项目使用教程1. 项目介绍Dify-Schedule 是一个基于 Go 语言的开源任务调度库，它提供了灵活的任务调度功能，支持定时任务和延时任务的执行。项目旨在
admin
1月前
150
网站建设
schedule_1x.py 代码注释
schedule_1x.py 代码注释 schedule_1x.py 代码注释 schedule_1x.py 代码注释 # optimizer#指定训练参数optimizer = dict(type='SGD',
admin
1月前
180
网站建设
SAP MM 事务代码VL10B对于有多个Delivery Schedule的STO item的处理
SAP MM 事务代码VL10B对于有多个Delivery Schedule的STO item的处理1, STO#4501379559.交货日期是2022-9-11，但是该item的delivery schedule有
admin
1月前
160
网站建设
使用腾讯云 COS 客户端进行批量文件删除的最佳实践
个人名片🎓作者简介：java领域优质创作者 🌐个人主页：码农阿豪 📞工作室：新空间代码工作室&am
admin
1月前
250
网站建设
Excel 文件损坏了打不开怎么办？几种 Excel 文件修复方法帮助你
当你想要打开电脑 Excel 文件的时候发现系统提示文件被损坏或者其他一些原因导致无法打开，这时候应该怎么办呢？别急下面为大家总结了 Excel 文件修复的一些方法。更改信任中心 Excel
admin
1月前
250
网站建设
mp4文件损坏怎么修复？三种修复办法分享！
对于我们平时使用到的MP4视频文件，有时候在播放时会遇到文件损坏，无法正常打开，针对这个问题，如何修复损坏的MP4视频文件？ 首先
admin
1月前
160
网站建设
php 浏览器保存网页图片,PHP实现浏览器文件下载图片或者php文件
PHP实现浏览器文件下载图片或者php文件需要通过header来输出下载否则会进行解析无法正确的下载文件哦，下面的我们就来看看吧。超链接下载如果浏览器支持超链接的方式下载文件，会在点击超链接的时候
admin
1月前
240
网站建设
关于JSP不能通过浏览器直接访问，要通过servlet跳转，但一个jsp文件里面用<iframe>标签包含了另一个jsp的访问问题
关于JSP不能通过浏览器直接访问，要通过servlet跳转，但一个jsp文件里面用<iframe>标签包含了另一个jsp的访问问题今天在上班的时候遇到一个问题，
admin
1月前
130
网站建设
html代码不兼容edge,edge兼容模式怎么设置？edge浏览器兼容性设置方法
edge浏览器是一款非常好用的浏览器，用户可以使用手机自由切换模式，这样用户就可以轻松浏览更多的内容了，使用起来超级的方便，各种内容都可以一手掌握&am
admin
1月前
220
网站建设
webpack当打包的依赖文件被修改时自动重新编译自动刷新浏览器运行效果 (WebpackDevServer)
这篇文章会基于我 (webpack打包时生成一个HTML 自动引入打包的js逻辑文件 (HtmlWebpackPlugin)) 这篇文章搭建的项目环境开展没有看过这篇文章的话，建议去看一下 https:blog.
admin
1月前
250
网站建设
玩转IDEA项目结构Project Structure，打Jar包、模块依赖管理全搞定
前言你好，我是A哥(YourBatman)。如何给Module模块单独增加依赖？ 如何知道哪些Module模块用了Spring框架，哪些是web工程&#xff
admin
1月前
220
网站建设
大数据测试环境服务器硬件推荐配置_最全（ContextCapture）倾斜摄影3D建模、单机集群硬件配置方案...
主要内容本文结合最新计算处理技术，针对倾斜摄影的空三计算、三维建模应用，给出目前最快、最高性价比的台式工作站、移动工作站、并行集群的多种配置方案 1. 相关机型介绍 2. 硬件配置方案 2.1 台式工作站配置推荐 2.2 便携式(单屏、三
admin
1月前
220
网站建设
跨电脑迁移Python项目：虚拟环境与依赖迁移的正确姿势（附避坑指南）
在Python项目开发中，将项目从电脑A迁移到电脑B是常见需求。虚拟环境和依赖的正确迁移是项目运行的关键，本文将详解两种主流方法，修正常见错误并提供最佳实践。一、方法一：直接复制虚拟环境（适合简单场景，需谨慎）核心逻辑：搬运虚拟环境
admin
1月前
200
网站建设
windows下如何把flutter项目打包成安装包
开发的前置工作我们不提了，网上有很多教程。这里到最后一步，执行flutter build windows后，{项目目录}buildwindowsrunnerRelea
admin
1月前
220

发表回复

评论列表（0条）

暂无评论

spark本地开发环境搭建

发表回复

评论列表（0条）

联系我们

400-800-8888

spark本地开发环境搭建

相关推荐

发表回复

评论列表（0条）

联系我们

400-800-8888