Spark笔记：RDD基本操作（上）

创建时间：2016-11-29 投稿人：浏览次数：1517

　原文链接：http://www.cnblogs.com/sharpxiajun/p/5506822.html

本文主要是讲解spark里RDD的基础操作。RDD是spark特有的数据模型，谈到RDD就会提到什么弹性分布式数据集，什么有向无环图，本文暂时不去展开这些高深概念，在阅读本文时候，大家可以就把RDD当作一个数组，这样的理解对我们学习RDD的API是非常有帮助的。本文所有示例代码都是使用scala语言编写的。

　　Spark里的计算都是操作RDD进行，那么学习RDD的第一个问题就是如何构建RDD，构建RDD从数据来源角度分为两类：第一类是从内存里直接读取数据，第二类就是从文件系统里读取，当然这里的文件系统种类很多常见的就是HDFS以及本地文件系统了。

　　第一类方式从内存里构造RDD，使用的方法：makeRDD和parallelize方法，如下代码所示：

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

/*
 使用makeRDD创建RDD */

/*
 List */

val rdd01 = sc.makeRDD(List(1,2,3,4,5,6)) val r01 = rdd01

.map
 { x

=

>
 x * x }

println(r01.collect().mkString(","))

/*
 Array */

val rdd02 = sc.makeRDD(Array(1,2,3,4,5,6)) val r02 = rdd02

.filter
 { x

=

>
 x <

5} println(r02.collect().mkString(",")) val rdd03 = sc.parallelize(List(1,2,3,4,5,6), 1) val r03 = rdd03

.map
 { x

=

>
 x +

1 } println(r03.collect().mkString(","))

/*
 Array */

val rdd04 = sc.parallelize(List(


                            
            声明：该文观点仅代表作者本人，牛骨文系教育信息发布平台，牛骨文仅提供信息存储空间服务。
            
                
                    上一篇：
			
				Spark学习使用笔记 - Scala篇（3）- 映射，元组			
                    下一篇：
			
				scala 数组Array排序,转换字符串，过滤 quickSort,mkString,yield,filter,map			
                
            
                    
        
            
                                    
                                
                
                
            

                        
                热门文章
                                
			
				CTF writeup 2_南邮网络攻防训...
                                
			
				SSM框架——详细整合教程（...
                                
			
				Linux Shell脚本编程－－curl命...
                                
			
				HttpClient使用详解			
                                
			
				Java面试题全集（上）			
                                
			
				JAVA设计模式之单例模式			
                                
			
				java.lang.OutOfMemoryError: PermGen ...
                                
			
				TCP协议中的三次握手和四次...
                                
			
				form表单的两种提交方式，su...
                                
			
				String,StringBuffer与StringBuilder...
                            
            
                        
                最新文章 
                                Java之品优购课程讲义_day20（7）
                                剑指 Offer - 8：跳台阶
                                Netty权威指南_札记02_NIO编程
                                mysql时间属性之时间戳和datetime之...
                                虚拟现实或许可以拯救古埃及的“...
                                spring cloud服务注册中心eureka---集群...
                                Java SE 第六章
                                HTTP请求+数据库
                                HIDL学习笔记之HIDL C++（第二天）
                                ubuntu系统下指定tomcat运行时为JDK1.8...
                            
                        
        
    


    
        
            
                网站首页
                tags
            
            
                学习手册
                html5
                css3
                THINKPHP 5.0 手册
            
            
                在线课程
                牛骨文前端
                网站建设
                SEO名词解释
            
        
        
            
                
                    服务热线
                    电话：175-0840-8227
                    上班时间：9:00-18:00
                
            
            
                
                关注微信公众号
            
        
     

copyright © 2008-2019 亿联网络 版权所有 备案号：粤ICP备14031511号-2