查看: 338|回复: 0

Spark中DataSet算子操作与RDD算子操作的异同

[复制链接]
论坛徽章:
1
spark徽章
日期:2018-08-24 10:52:51
发表于 2018-6-10 20:35 | 显示全部楼层 |阅读模式

数据库 SQL Spark

  对于学习Spark的同学,对RDD的算子操作并不陌生,而在Spark SQL中,标准的数据单元是DataSet,从数据库中读取的数据可以转化为DataSet类型,Spark为我们提供了很多操作DataSet的算子,这些算子大部分与RDD的算子有着相同的名称和用途,但是在使用细节上有一定的差异,你都见到过哪些DataSet与RDD相同名称但是使用方法不同的算子呢?

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

 

GMT+8, 2018-11-13 04:26 , Processed in 0.115531 second(s), 29 queries .