从mysql读数据创建DataFrame
2021/6/18 2:05:29
本文主要是介绍从mysql读数据创建DataFrame,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
第一种方式spark.read.jdbc()
object _01_ReadJDBC { def main(args: Array[String]): Unit = { //1、创建spark session val spark: SparkSession = SparkSession.builder().master("local[*]").getOrCreate() val properties = new Properties() properties.setProperty("user","root") properties.setProperty("password","123456") properties.setProperty("query","id >= 2") //Both 'dbtable' and 'query' can not be specified at the same time. //从jdbc中读取数据 val dataFrame = spark.read.jdbc("jdbc:mysql://localhost:3306/sql_01?characterEncoding=utf8", "stu", properties) //加上过滤条件 dataFrame.createTempView("jdbc_01") val frame = spark.sql( """ |select id,name |from |jdbc_01 |where id >= 2; |""".stripMargin) frame.show() spark.stop() } }
第二种方式spark.read.format(“jdbc”).options(pro).load()
object _02_ReadJDBC { def main(args: Array[String]): Unit = { //获取session对象 val spark: SparkSession = SparkSession.builder().master("local[*]").getOrCreate() //从jdbc中读取数据并且进行过滤 val pro = new mutable.HashMap[String,String]() pro.put("url","jdbc:mysql://localhost:3306/sql_01?characterEncoding=utf8") pro.put("user","root") pro.put("password","123456") pro.put("query","select * from users where userid >= 8 ") //pro.put("dbtable","users") //DataFrame一定会有Schema信息,这是读取mysql的schema信息获取的 val dataFrame: DataFrame = spark.read.format("jdbc").options(pro).load() dataFrame.show() spark.stop() } }
这篇关于从mysql读数据创建DataFrame的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-06-25MySQL报错Duplicate entry '0' for key 'PRIMARY'
- 2024-05-29阿里 Canal 实时同步 MySQL 增量数据至 ClickHouse 数据库
- 2024-05-24在Linux下管理MySQL的大小写敏感性
- 2024-04-26MySQL查出时间比实际晚8小时的解决方案
- 2024-04-01JPA不识别MySQL的枚举类型
- 2024-03-30mysql数据库表卡死解决方法
- 2024-03-15MySQL多数据源笔记5-ShardingJDBC实战
- 2024-03-11natural join mysql
- 2024-03-11关于VS2017,VS2015 中利用 EF使用Mysql 不显示数据源问题解决方案
- 2024-02-26mysql 阿里云xb后缀备份文件恢复-icode9专业技术文章分享