Try 与错误处理

最后更新于:2022-04-01 02:13:30

当你在尝试一门新的语言时,可能不会过于关注程序出错的问题,但当真的去创造可用的代码时,就不能再忽视代码中的可能产生的错误和异常了。鉴于各种各样的原因,人们往往低估了语言对错误处理支持程度的重要性。 事实会表明,Scala 能够很优雅的处理此类问题,这一部分,我会介绍 Scala 基于 Try 的错误处理机制,以及这背后的原因。我将使用一个在 _Scala 2.10_ 新引入的特性,该特性向 _2.9.3_ 兼容,因此,请确保你的 Scala 版本不低于 _2.9.3_。 ### 异常的抛出和捕获 在介绍 Scala 错误处理的惯用法之前,我们先看看其他语言(如,Java,Ruby)的错误处理机制。和这些语言类似,Scala 也允许你抛出异常: ~~~ case class Customer(age: Int) class Cigarettes case class UnderAgeException(message: String) extends Exception(message) def buyCigarettes(customer: Customer): Cigarettes = if (customer.age < 16) throw UnderAgeException(s"Customer must be older than 16 but was ${customer.age}") else new Cigarettes ~~~ 被抛出的异常能够以类似 Java 中的方式被捕获,虽然是使用偏函数来指定要处理的异常类型。此外,Scala 的 `try/catch` 是表达式(返回一个值),因此下面的代码会返回异常的消息: ~~~ val youngCustomer = Customer(15) try { buyCigarettes(youngCustomer) "Yo, here are your cancer sticks! Happy smokin'!" } catch { case UnderAgeException(msg) => msg } ~~~ ### 函数式的错误处理 现在,如果代码中到处是上面的异常处理代码,那它很快就会变得丑陋无比,和函数式程序设计非常不搭。对于高并发应用来说,这也是一个很差劲的解决方式,比如,假设需要处理在其他线程执行的 actor 所引发的异常,显然你不能用捕获异常这种处理方式,你可能会想到其他解决方案,例如去接收一个表示错误情况的消息。 一般来说,在 Scala 中,好的做法是通过从函数里返回一个合适的值来通知人们程序出错了。别担心,我们不会回到 C 中那种需要使用按约定进行检查的错误编码的错误处理。相反,Scala 使用一个特定的类型来表示可能会导致异常的计算,这个类型就是 Try。 #### Try 的语义 解释 Try 最好的方式是将它与上一章所讲的 Option 作对比。 `Option[A]` 是一个可能有值也可能没值的容器,`Try[A]` 则表示一种计算:这种计算在成功的情况下,返回类型为 `A` 的值,在出错的情况下,返回 `Throwable` 。这种可以容纳错误的容器可以很轻易的在并发执行的程序之间传递。 Try 有两个子类型: 1. `Success[A]`:代表成功的计算。 1. 封装了 `Throwable` 的 `Failure[A]`:代表出了错的计算。 如果知道一个计算可能导致错误,我们可以简单的使用 `Try[A]` 作为函数的返回类型。这使得出错的可能性变得很明确,而且强制客户端以某种方式处理出错的可能。 假设,需要实现一个简单的网页爬取器:用户能够输入想爬取的网页 URL,程序就需要去分析 URL 输入,并从中创建一个 `java.net.URL` : ~~~ import scala.util.Try import java.net.URL def parseURL(url: String): Try[URL] = Try(new URL(url)) ~~~ 正如你所看到的,函数返回类型为 `Try[URL]`:如果给定的 url 语法正确,这将是 `Success[URL]`,否则, `URL` 构造器会引发 `MalformedURLException` ,从而返回值变成 `Failure[URL]` 类型。 上例中,我们还用了 Try 伴生对象里的 `apply` 工厂方法,这个方法接受一个类型为 `A` 的 _传名参数_,这意味着, `new URL(url)` 是在 `Try` 的 `apply` 方法里执行的。 `apply` 方法不会捕获任何非致命的异常,仅仅返回一个包含相关异常的 Failure 实例。 因此, `parseURL("http://danielwestheide.com")` 会返回一个 `Success[URL]` ,包含了解析后的网址,而 `parseULR("garbage")` 将返回一个含有 `MalformedURLException` 的 `Failure[URL]`。 #### 使用 Try 使用 Try 与使用 Option 非常相似,在这里你看不到太多新的东西。 你可以调用 `isSuccess` 方法来检查一个 Try 是否成功,然后通过 `get` 方法获取它的值,但是,这种方式的使用并不多见,因为你可以用 `getOrElse` 方法给 Try 提供一个默认值: ~~~ val url = parseURL(Console.readLine("URL: ")) getOrElse new URL("http://duckduckgo.com") ~~~ 如果用户提供的 URL 格式不正确,我们就使用 DuckDuckGo 的 URL 作为备用。 #### 链式操作 Try 最重要的特征是,它也支持高阶函数,就像 Option 一样。在下面的示例中,你将看到,在 Try 上也进行链式操作,捕获可能发生的异常,而且代码可读性不错。 #### Mapping 和 Flat Mapping 将一个是 `Success[A]` 的 `Try[A]` 映射到 `Try[B]` 会得到 `Success[B]` 。如果它是 `Failure[A]` ,就会得到 `Failure[B]` ,而且包含的异常和 `Failure[A]` 一样。 ~~~ parseURL("http://danielwestheide.com").map(_.getProtocol) // results in Success("http") parseURL("garbage").map(_.getProtocol) // results in Failure(java.net.MalformedURLException: no protocol: garbage) ~~~ 如果链接多个 `map` 操作,会产生嵌套的 Try 结构,这并不是我们想要的。考虑下面这个返回输入流的方法: ~~~ import java.io.InputStream def inputStreamForURL(url: String): Try[Try[Try[InputStream]]] ` parseURL(url).map { u `> Try(u.openConnection()).map(conn => Try(conn.getInputStream)) } ~~~ 由于每个传递给 `map` 的匿名函数都返回 Try,因此返回类型就变成了 `Try[Try[Try[InputStream]]]` 。 这时候, `flatMap` 就派上用场了。`Try[A]` 上的 `flatMap` 方法接受一个映射函数,这个函数类型是 `(A) => Try[B]`。如果我们的 `Try[A]` 已经是 `Failure[A]` 了,那么里面的异常就直接被封装成 `Failure[B]` 返回,否则, `flatMap` 将 `Success[A]` 里面的值解包出来,并通过映射函数将其映射到 `Try[B]` 。 这意味着,我们可以通过链接任意个 `flatMap` 调用来创建一条操作管道,将值封装在 Success 里一层层的传递。 现在让我们用 `flatMap` 来重写先前的例子: ~~~ def inputStreamForURL(url: String): Try[InputStream] = parseURL(url).flatMap { u => Try(u.openConnection()).flatMap(conn => Try(conn.getInputStream)) } ~~~ 这样,我们就得到了一个 `Try[InputStream]`,它可以是一个 Failure,包含了在 `flatMap` 过程中可能出现的异常;也可以是一个 Success,包含了最后的结果。 #### 过滤器和 foreach 当然,你也可以对 Try 进行过滤,或者调用 `foreach` ,既然已经学过 Option,对于这两个方法也不会陌生。 当一个 Try 已经是 `Failure` 了,或者传递给它的谓词函数返回假值,`filter` 就返回 `Failure`(如果是谓词函数返回假值,那 `Failure` 里包含的异常是 `NoSuchException` ),否则的话, `filter` 就返回原本的那个 `Success` ,什么都不会变: ~~~ def parseHttpURL(url: String) ` parseURL(url).filter(_.getProtocol `= "http") parseHttpURL("http://apache.openmirror.de") // results in a Success[URL] parseHttpURL("ftp://mirror.netcologne.de/apache.org") // results in a Failure[URL] ~~~ 当一个 Try 是 `Success` 时, `foreach` 允许你在被包含的元素上执行副作用,这种情况下,传递给 `foreach` 的函数只会执行一次,毕竟 Try 里面只有一个元素: ~~~ parseHttpURL("http://danielwestheide.com").foreach(println) ~~~ > 当 Try 是 Failure 时, `foreach` 不会执行,返回 `Unit` 类型。 ### for 语句中的 Try 既然 Try 支持 `flatMap` 、 `map` 、 `filter` ,能够使用 for 语句也是理所当然的事情,而且这种情况下的代码更可读。为了证明这一点,我们来实现一个返回给定 URL 的网页内容的函数: ~~~ import scala.io.Source def getURLContent(url: String): Try[Iterator[String]] = for { url <- parseURL(url) connection <- Try(url.openConnection()) is <- Try(connection.getInputStream) source = Source.fromInputStream(is) } yield source.getLines() ~~~ 这个方法中,有三个可能会出错的地方,但都被 Try 给涵盖了。第一个是我们已经实现的 `parseURL` 方法,只有当它是一个 `Success[URL]` 时,我们才会尝试打开连接,从中创建一个新的 `InputStream` 。如果这两步都成功了,我们就 `yield` 出网页内容,得到的结果是 `Try[Iterator[String]]` 。 当然,你可以使用 `Source#fromURL` 简化这个代码,并且,这个代码最后没有关闭输入流,这都是为了保持例子的简单性,专注于要讲述的主题。 > 在这个例子中,`Source#fromURL`可以这样用: ~~~ import scala.io.Source def getURLContent(url: String): Try[Iterator[String]] = for { url <- parseURL(url) source = Source.fromURL(url) } yield source.getLines() ~~~ > 用 `is.close()` 可以关闭输入流。 #### 模式匹配 代码往往需要知道一个 Try 实例是 Success 还是 Failure,这时候,你应该想到模式匹配,也幸好, `Success` 和 `Failure` 都是样例类。 接着上面的例子,如果网页内容能顺利提取到,我们就展示它,否则,打印一个错误信息: ~~~ import scala.util.Success import scala.util.Failure getURLContent("http://danielwestheide.com/foobar") match { case Success(lines) => lines.foreach(println) case Failure(ex) => println(s"Problem rendering URL content: ${ex.getMessage}") } ~~~ #### 从故障中恢复 如果想在失败的情况下执行某种动作,没必要去使用 `getOrElse`,一个更好的选择是 `recover` ,它接受一个偏函数,并返回另一个 Try。如果 `recover` 是在 Success 实例上调用的,那么就直接返回这个实例,否则就调用偏函数。如果偏函数为给定的 `Failure` 定义了处理动作,`recover` 会返回 `Success` ,里面包含偏函数运行得出的结果。 下面是应用了 `recover` 的代码: ~~~ import java.net.MalformedURLException import java.io.FileNotFoundException val content = getURLContent("garbage") recover { case e: FileNotFoundException => Iterator("Requested page does not exist") case e: MalformedURLException => Iterator("Please make sure to enter a valid URL") case _ => Iterator("An unexpected error has occurred. We are so sorry!") } ~~~ 现在,我们可以在返回值 `content` 上安全的使用 `get` 方法了,因为它一定是一个 Success。调用 `content.get.foreach(println)` 会打印 _Please make sure to enter a valid URL_。 ### 总结 Scala 的错误处理和其他范式的编程语言有很大的不同。Try 类型可以让你将可能会出错的计算封装在一个容器里,并优雅的去处理计算得到的值。并且可以像操作集合和 Option 那样统一的去操作 Try。 Try 还有其他很多重要的方法,鉴于篇幅限制,这一章并没有全部列出,比如 `orElse` 方法,`transform` 和 `recoverWith` 也都值得去看。 下一章,我们会探讨 Either,另外一种可以代表计算的类型,但它的可使用范围要比 Try 大的多。
';