函数式编程
最后更新于:2022-04-01 03:05:56
面向值(value-oriented )编程有很多优势,特别是用在与函数式编程结构相结合。这种风格强调值的转换(译注:由一个不变的值生成另一个不变的值)而非状态的改变,生成的代码是指称透明的(referentially transparent),提供了更强的不变型(invariants),因此容易实现。Case类(也被翻译为样本类),模式匹配,解构绑定(destructuring bindings),类型推断,轻量级的闭包和方法创建语法都是这一类的工具。
### Case类模拟代数数据类型
Case类可实现代数数据类型(ADT)编码:它们对大量的数据结构进行建模时有用,用强不变类型(invariants)提供了简洁的代码。尤其在结合模式匹配情况下。模式匹配实现了全面解析提供更强大的静态保护。 (译注:ADTs是Algebraic Data Type代数数据类型的缩写,关于这个概念见我的另一篇[博客](http://hongjiang.info/scala-case-class-and-algebraic-data-type/))
下面是用case类模拟代数数据类型的模式
~~~
sealed trait Tree[T]
case class Node[T](left: Tree[T], right: Tree[T]) extends Tree[T]
case class Leaf[T](value: T) extends Tree[T]
~~~
类型 Tree[T] 有两个构造函器:Node和Leaf。定义类型为sealed(封闭类)允许编译器进行彻底的分析(这是针对模式匹配的,参考Programming in Scala)因为构造器将不能从外部源文件中添加。
与模式匹配一同,这个建模使得代码简洁并且显然是正确的(obviously correct)
~~~
def findMin[T <: Ordered[T]](tree: Tree[T]) = tree match {
case Node(left, right) => Seq(findMin(left), findMin(right)).min
case Leaf(value) => value
}
~~~
尽管一些递归结构,如树的组成是典型的ADTs(代数数据类型)应用,它们的用处领域更大。 disjoint,unions特别容易的用ADTs建模;这些频繁发生在状态机上(state machines)。
### Options
Option类型是一个容器,空(None)或满(Some(value))二选一。它提供了使用null的另一种安全选择,应该尽可能的替代null。它是一个集合(最多只有一个元素)并用集合操所修饰,尽量用Option。
用
~~~
var username: Option[String] = None
...
username = Some("foobar")
~~~
代替
~~~
var username: String = null
...
username = "foobar"
~~~
因为前者更安全:Option类型静态地强制username必须对空(emptyness)做检测。
对一个Option值做条件判断应该用foreach
~~~
if (opt.isDefined)
operate(opt.get)
~~~
上面的代码应该用下面的方式替代:
~~~
opt foreach { value =>
operate(value)}
~~~
风格可能看起来有些古怪,但更安全,更简洁。如果两种情况都有(Option的None或Some),用模式匹配
~~~
opt match {
case Some(value) => operate(value)
case None => defaultAction()
}
~~~
但如果缺少的是缺省值,用getOrElse方法:
~~~
operate(opt getOrElse defaultValue)
~~~
不要过度使用Option: 如果有一个明确的缺省值——一个[*Null对象*](http://en.wikipedia.org/wiki/Null_Object_pattern)——直接用Null而不必用Option
Option还有一个方便的构造器用于包装空值(nullable value)
~~~
Option(getClass.getResourceAsStream("foo"))
~~~
得到一个 Option[InputStream] 假定空值(None)时getResourceAsStream会返回null。
### 模式匹配
模式匹配(x match { …) 在良好的Scala代码中无处不在:用于合并条件执行、解构(destructuring) 、在构造中造型。使用好模式匹配可以增加程序的明晰度和安全性。
使用模式匹配实现类型转换:
~~~
obj match {
case str: String => ...
case addr: SocketAddress => ...
~~~
模式匹配在和解构(destructuring)联合使用时效果最好(例如你要匹配case类);下面的写法
~~~
animal match {
case dog: Dog => "dog (%s)".format(dog.breed)
case _ => animal.species
}
~~~
应该被替代为:
~~~
animal match {
case Dog(breed) => "dog (%s)".format(breed)
case other => other.species
}
~~~
写[自定义的抽取器](http://www.scala-lang.org/node/112) (extractor)时必须有双重构造器(译注:成对出现的apply方法与unapply方法),否则可能是不适合的。
当默认的方法更有意义时,对条件执行不要用模式匹配。集合库的方法通常返回Options,避免:
~~~
val x = list match {
case head :: _ => head
case Nil => default
}
~~~
因为
~~~
val x = list.headOption getOrElse default
~~~
更短并且更能表达目的。
### 偏函数
Scala提供了定义PartialFunction的语法简写:
~~~
val pf: PartialFunction[Int, String] = {
case i if i%2 == 0 => "even"
}
~~~
它们也可能和 orElse 组合:
~~~
val tf: (Int => String) = pf orElse { case _ => "odd"}
tf(1) == "odd"
tf(2) == "even"
~~~
偏函数出现在很多场景,并以PartialFunction有效地编码 ,例如 方法参数:
~~~
trait Publisher[T] {
def subscribe(f: PartialFunction[T, Unit])
}
val publisher: Publisher[Int] = ..
publisher.subscribe {
case i if isPrime(i) => println("found prime", i)
case i if i%2 == 0 => count += 2
/* ignore the rest */
}
~~~
或在返回一个Option的情况下:
~~~
// Attempt to classify the the throwable for logging.
type Classifier = Throwable => Option[java.util.logging.Level]
~~~
可以更好的用PartialFunction表达
~~~
type Classifier = PartialFunction[Throwable, java.util.Logging.Level]
~~~
因为它提供了更好的可组合性:
~~~
val classifier1: Classifier
val classifier2: Classifier
val classifier = classifier1 orElse classifier2 orElse { _ => java.util.Logging.Level.FINEST }
~~~
### 解构绑定
解构绑定与模式匹配有关。它们用了相同的机制,但解构绑定可应用在当匹配只有一种选项的时候 (以免你接受异常的可能)。解构绑定特别适用于元组(tuple)和样本类(case class).
~~~
val tuple = ('a', 1)
val (char, digit) = tuple
val tweet = Tweet("just tweeting", Time.now)
val Tweet(text, timestamp) = tweet
~~~
### 惰性赋值
当使用lazy修饰一个val成员时,其赋值情况是在需要时才赋值的(by need),因为Scala中成员与方法是等价的(除了private[this]成员)
~~~
lazy val field = computation()
~~~
相当于下面的简写:
~~~
var _theField = None
def field = if (_theField.isDefined) _theField.get else {
_theField = Some(computation())
_theField.get
}
~~~
也就是说,它在需要时计算结果并会记住结果,在要达到这种目的时使用lazy成员;但当语意上需要惰性赋值时(by semantics),要避免使用惰性赋值,这种情况下,最好显式赋值因为它使得成本模型是明确的,并且副作用被严格的控制。
Lazy成员是线程安全的。
### 传名调用
方法参数可以指定为传名参数 (by-name) 意味着参数不是绑定到一个值,而是一个可能需要反复进行的计算。这一特性需要小心使用; 期待传值(by-value)语法的调用者会感到惊讶。这一特性的动机是构造语法自然的 DSLs——使新的控制结构可以看起来更像本地语言特征。
只在下面的控制结构中使用传名调用, 调用者明显传递的是一段代码块(block)而非一个确定的计算结果。传名参数必须放在参数列表的最后一位。当使用传名调用时,确保方法名称让调用者明显感知到方法参数是传名参数。
当你想要一个值被计算多次,特别是这个计算会引起副作用时,使用显式函数:
~~~
class SSLConnector(mkEngine: () => SSLEngine)
~~~
这样意图很明确,调用者不会感到惊奇。
### `flatMap`
flatMap——结合了map 和 flatten —— 的使用要特别小心,它有着难以琢磨的威力和强大的实用性。类似它的兄弟 map,它也是经常在非传统的集合中使用的,例如 Future , Option。它的行为由它的(函数)签名揭示;对于一些容器 Container[A]
~~~
flatMap[B](f: A => Container[B]): Container[B]
~~~
flatMap对集合中的每个元素调用了 函数 f 产生一个新的集合,将它们全部 flatten 后放入结果中。例如,获取两个字符的字符串的所有排列,相同的字符不能出现两次
~~~
val chars = 'a' to 'z'
val perms = chars flatMap { a =>
chars flatMap { b =>
if (a != b) Seq("%c%c".format(a, b))
else Seq()
}
}
~~~
等价于下面这段更简洁的 for-comprehension (基本就是针对上面的语法糖)
~~~
val perms = for {
a <- chars
b <- chars
if a != b
} yield "%c%c".format(a, b)
~~~
`flatMap`在处理Options常常很有用—— 它将多个options链合并为一个,
~~~
val host: Option[String] = ..
val port: Option[Int] = ..
val addr: Option[InetSocketAddress] =
host flatMap { h =>
port map { p =>
new InetSocketAddress(h, p)
}
}
~~~
也可以使用更简洁的for来实现:
~~~
val addr: Option[InetSocketAddress] = for {
h <- host
p <- port
} yield new InetSocketAddress(h, p)
~~~
对flatMap在在Futures中的使用[futures一节](http://twitter.github.io/effectivescala/index-cn.html#Twitter's%20standard%20libraries-Futures)中有讨论。