下面我们来学习一下scala中最重要的内容,函数式编程,其实我们学习Scala这门语言就是因为它的这一个特性,咱们在最开始的时候给大家演示了,使用java代码实现函数式编程是很复杂的,而使用scala代码实现函数式编程就很轻松,很简单了。
这块内容我们在后续工作中会经常使用,需要大家重点掌握。
Scala是一门既面向对象,又面向过程的语言。
因此在Scala中有非常好的面向对象的特性,可以使用Scala来基于面向对象的思想开发大型复杂的系统和工程;
而且Scala也面向过程,因此Scala中有函数的概念。
在Scala中,函数与类、对象一样,都是一等公民,所以说scala的面向过程其实就重在针对函数的编程了,所以称之为函数式编程。
Scala中的函数是一等公民,可以独立定义,独立存在,而且可以直接将函数作为值赋值给变量
Scala的语法规定,将函数赋值给变量时,必须在函数后面加上空格和下划线
来看一个案例:将函数赋值给变量:
scala> def sayHello(name: String) { println("Hello, " + name) }
sayHello: (name: String)Unit
scala> val sayHelloFunc = sayHello _
sayHelloFunc: String => Unit =
scala> sayHelloFunc("scala")
Hello, scala
Scala中的函数也可以不需要命名,这种函数称为匿名函数
匿名函数的语法格式:(参数名: 参数类型) => 函数体
(参数名: 参数类型) :是函数的参数列表
可以将匿名函数直接赋值给某个变量
来看一个例子
scala> val sayHelloFunc = (name: String) => println("Hello, " + name)
sayHelloFunc: String => Unit =
scala> val sayHelloFunc = (name: String) => {println("Hello, " + name)}
sayHelloFunc: String => Unit =
注意:如果函数体有多行代码,则需要添加{}
由于函数是一等公民,所以说我们可以直接将某个函数作为参数传入其它函数
这个功能是极其强大的,也是Java这种面向对象的编程语言所不具备的
这个功能在实际工作中是经常需要用到的
接收其它函数作为当前函数的参数,当前这个函数也被称作高阶函数 (higher-order function)
看一个例子:
先定义一个匿名函数,赋值给变量sayHelloFunc
val sayHelloFunc = (name: String) => println("Hello, " + name)
再定义一个高阶函数,这个高阶函数的参数会接收一个函数
参数: (String) => Unit 表示这个函数接收一个字符串,没有返回值
def greeting(func: (String) => Unit, name: String) { func(name) }
scala> greeting(sayHelloFunc, "scala")
Hello, scala
scala> greeting((name: String) => println("Hello, " + name),"scala")
Hello, scala
高阶函数可以自动推断出它里面函数的参数类型,对于只有一个参数的函数,还可以省去小括号
看下面这个例子:
# 先定义一个高阶函数
def greeting(func: (String) => Unit, name: String) { func(name) }
# 使用高阶函数:完整写法
greeting((name: String) => println("Hello, " + name), "scala")
# 使用高阶函数:高阶函数可以自动推断出参数类型,而不需要写明类型
greeting((name) => println("Hello, " + name), "scala")
# 使用高阶函数:对于只有一个参数的函数,还可以省去其小括号
greeting(name => println("Hello, " + name), "scala")
刚才是我们自己实现的高阶函数,其实我们在工作中自己定义高阶函数的场景不多,大部分场景都是去使用已有的高阶函数
下面我们来看几个常见的高阶函数:
map:对传入的每个元素都进行处理,返回一个元素
flatMap:对传入的每个元素都进行处理,返回一个或者多个元素
foreach:对传入的每个元素都进行处理,但是没有返回值
filter:对传入的每个元素都进行条件判断,如果返回true,则保留该元素,否则过滤掉该元素
reduceLeft:从左侧元素开始,进行reduce操作
map的使用:
scala> Array(1, 2, 3, 4, 5).map(num=>{num * 2})
res38: Array[Int] = Array(2, 4, 6, 8, 10)
可以简写为:
scala> Array(1, 2, 3, 4, 5).map(_ * 2)
res40: Array[Int] = Array(2, 4, 6, 8, 10)
flagMap的使用
scala> Array("hello you","hello me").flatMap(line=>line.split(" "))
res53: Array[String] = Array(hello, you, hello, me)
可以简写为:
scala> Array("hello you","hello me").flatMap(_.split(" "))
res54: Array[String] = Array(hello, you, hello, me)
foreach的使用
scala> Array(1, 2, 3, 4, 5).map(_ * 2).foreach(num=>println(num))
2
4
6
8
10
可以简写为:
scala> Array(1, 2, 3, 4, 5).map(_ * 2).foreach(println(_))
2
4
6
8
10
还可以再简写为:
scala> Array(1, 2, 3, 4, 5).map(_ * 2).foreach(println _)
2
4
6
8
10
filter的使用
scala> Array(1, 2, 3, 4, 5).filter(num=>num % 2 == 0)
res46: Array[Int] = Array(2, 4)
可以简写为:
scala> Array(1, 2, 3, 4, 5).filter(_ % 2 == 0)
res47: Array[Int] = Array(2, 4)
reduceLeft的使用
表示先对元素1和元素2进行处理,然后将结果与元素3处理,再将结果与元素4处理,依次类推
spark中有一个reduce函数,和这个函数的效果一致
scala> Array(1, 2, 3, 4, 5).reduceLeft((t1,t2)=>t1+t2)
res50: Int = 15
这个操作操作就相当于1 + 2 + 3 + 4 + 5
可以简写为:
scala> Array(1, 2, 3, 4, 5).reduceLeft( _ + _)
res49: Int = 15
注意:这里的两个_代表是两个元素