java maven开发spark demo程序
2022/1/13 14:03:35
本文主要是介绍java maven开发spark demo程序,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
在完成spark环境安装部署之后,部署过程这里略过,就可以通过java开发spark程序了。
1. 添加程序依赖
<dependencies> <!-- spark-core spark核心--> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-core_2.12</artifactId> <version>2.4.8</version> </dependency> <!-- spark-streaming spark流计算--> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-streaming_2.12</artifactId> <version>2.4.8</version> </dependency> </dependencies>
2. 编写测试程序
package com.demo; import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaRDD; import org.apache.spark.api.java.JavaSparkContext; import org.apache.spark.api.java.function.Function; /** * author: */ public class SparkDemo { public static void main(String[] args) { String readme = "D:\\spark\\CHANGES.txt"; SparkConf conf = new SparkConf().setAppName("tiger's first spark app"); conf.setMaster("local[2]"); JavaSparkContext sc = new JavaSparkContext(conf); // 从指定的文件中读取数据到RDD JavaRDD<String> logData = sc.textFile(readme).cache(); // 过滤包含h的字符串,然后在获取数量 long num = logData.filter(new Function<String, Boolean>() { public Boolean call(String s) { return s.contains("h"); } }).count(); System.out.println("the count of word a is " + num); } }
conf.setMaster()的参数及含义如下:
- local 本地单线程
- local[K] 本地多线程(指定K个内核)
- local[*] 本地多线程(指定所有可用内核)
- spark://HOST:PORT 连接到指定的 Spark standalone cluster master,需要指定端口。
- mesos://HOST:PORT 连接到指定的 Mesos 集群,需要指定端口。
- yarn-client客户端模式 连接到 YARN 集群。需要配置 HADOOP_CONF_DIR。
- yarn-cluster集群模式 连接到 YARN 集群。需要配置 HADOOP_CONF_DIR。
3. 准备好测试数据文件
D:\\spark\\CHANGES.txt
Thing is test hello word test test hello word
4. 运行程序
可以得到输出结果
以上输出,可以验证程序可以正确运行了。
这篇关于java maven开发spark demo程序的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-15JavaMailSender是什么,怎么使用?-icode9专业技术文章分享
- 2024-11-15JWT 用户校验学习:从入门到实践
- 2024-11-15Nest学习:新手入门全面指南
- 2024-11-15RestfulAPI学习:新手入门指南
- 2024-11-15Server Component学习:入门教程与实践指南
- 2024-11-15动态路由入门:新手必读指南
- 2024-11-15JWT 用户校验入门:轻松掌握JWT认证基础
- 2024-11-15Nest后端开发入门指南
- 2024-11-15Nest后端开发入门教程
- 2024-11-15RestfulAPI入门:新手快速上手指南