(十一):生成器 Generators,续篇

最后更新于:2022-04-01 23:36:06

> 原文出处:http://www.infoq.com/cn/articles/es6-in-depth-generators-continued 欢迎回到深入浅出ES6专栏,望你在ES6探索之旅中收获知识与快乐!程序员们在工作之余应当补充些额外的知识,现在我们继续深入浅出生成器,我已经为你们准备好非常棒的讨论话题。 在之前的文章《[深入浅出ES6(三):生成器 Generators](http://www.infoq.com/cn/articles/es6-in-depth-generators)》中,我为大家介绍了ES6中引入的新特性——生成器(Generators),我认为它是ES6中最具魔力的特性,很可能是异步编程下一步的发展方向。后来我这样写道: > 生成器还有更多未提及的特性,例如:.throw()和.return()方法、可选参数.next()、yield*表达式语法。由于行文过长,估计观众老爷们已然疲乏,我们应该学习一下生成器,暂时yield在这里,剩下的干货择机为大家献上。 此时此刻,我们再续前缘。 阅读本文前,你最好先阅读一下[文章的第1部分](http://www.infoq.com/cn/articles/es6-in-depth-generators),文章比较长,你可能看得云里雾里,但那儿有一只会说话的猫陪伴你,非常有趣! ## 快速回顾 在第三篇文章中,我们着重讲解了生成器的基本行为。你可能对此感到陌生,但是并不难理解。生成器函数与普通函数有很多相似之处,它们之间最大的不同是,普通函数一次执行完毕,而生成器函数体每次执行一部分,每当执行到一个yield表达式的时候就会暂停。 尽管在[那篇文章](http://www.infoq.com/cn/articles/es6-in-depth-generators)中我们进行过详细解释,但我们始终未把所有特性结合起来给大家讲解示例。现在就让我们出发吧! ~~~ function* somewords() { yield "hello"; yield "world"; } for (var word of somewords()) { alert(word); } ~~~ 这段脚本简单易懂,但是如果你把代码中不同的比特位当做戏剧中的任务,你会发现它变得如此与众不同。穿上新衣的代码看起来是这样的: * * * > (译者注:下面这是原作者创作的一个剧本,他将ES6中的各种函数和语法拟人化,以讲解生成器(Generator)的实现原理) 场景 - 另一个世界的计算机,白天 for loop女士独自站在舞台上,戴着一顶安全帽,手里拿着一个笔记板,上面记载着所有的事情。 ~~~ for loop: (电话响起) somewords()! ~~~ generator出现:这是一位高大的、有着一丝不苟绅士外表的黄铜机器人。 它看起来足够友善,但给人的感觉仍然是冷冰冰的金属。 ~~~ for loop: (潇洒地拍了拍她的手) 好吧!我们去找些事儿做吧。 (对generator说) .next()! ~~~ generator动了起来,就像突然拥有了生命。 ~~~ generator: {value: "hello", done: false} ~~~ 然而猝不及防的,它以一个滑稽的姿势停止了动作。 ~~~ for loop: alert! ~~~ alert小子飞快冲进舞台,眼睛大睁,上气不接下气。我们感觉的到他一向如此。 ~~~ for loop: 对user说“hello”。 ~~~ alert小子转身冲下舞台。 ~~~ alert: (舞台下,大声尖叫) 一切都静止了! 你正在访问的页面说, “hello”! ~~~ 停留了几秒钟后,alert小子跑回舞台,穿过所有人滑停在for loop女士身边。 ~~~ alert: user说ok。 for loop: (潇洒地拍了拍她的手) 好吧!我们去找些事儿做吧。 (回到generator身边) .next()! ~~~ generator又一次焕发生机。 ~~~ generator: {value: "world", done: false} ~~~ 它换了个姿势又一次冻结。 ~~~ for loop: alert! alert: (已经跑起来) 正在搞定! (舞台下,大声尖叫) 一切都静止了! 你正在访问的页面说, “world”! ~~~ 又一次暂停,然后alert突然跋涉回到舞台,垂头丧气的。 ~~~ alert: user再一次说ok,但是… 但是请阻止这个页面 创建额外的对话。 ~~~ 他噘着嘴离开了。 ~~~ for loop: (潇洒地拍了拍她的手) 好吧!我们去找些事儿做吧。 (回到generator身边) .next()! ~~~ generator第三次焕发生机。 ~~~ generator: (庄严的) {value: undefined, done: true} ~~~ 它的头低下了,光芒从它的眼里消失。它不再移动。 ~~~ for loop 我的午餐时间到了。 ~~~ 她离开了。 一会儿,garbage collector(垃圾收集器)老头进入,捡起了奄奄一息的generator,将它带下舞台。 好吧,这一出戏不太像哈姆雷特,但你应该可以想象得出来。 * * * 好吧,这一出戏不太像哈姆雷特,但你应该可以想象得出来。 正如你在戏剧中看到的,当生成器对象第一次出现时,它立即暂停了。每当调用它的`.next()`方法,它都会苏醒并向前执行一部分。 所有动作都是单线程同步的。请注意,无论何时永远只有一个真正活动的角色,角色们不会互相打断,亦不会互相讨论,他们轮流讲话,只要他们的话没有说完都可以继续说下去。(就像莎士比亚一样!) 每当`for-of`循环遍历生成器时,这出戏的某个版本就展开了。这些`.next()`方法调用序列永远不会在你的代码的任何角落出现,在剧本里我把它们都放在舞台上了,但是对于你和你的程序而言,所有这一切都应该在幕后完成,因为生成器和`for-of`循环就是被设计成通过[迭代器接口](http://www.ecma-international.org/ecma-262/6.0/index.html#sec-iterator-interface)联结工作的。 所以,总结一下到目前为止所有的一切: * 生成器对象是可以产生值的优雅的黄铜机器人。 * 每个生成器函数体构成的单一代码块就是一个机器人。 ## 如何关停生成器 我在第1部分没有提到这些繁琐的生成器特性: * generator.return() * generator.next()的可选参数 * generator.throw(error) * yield* 如果你不理解这些特性存在得意义,就很难对它们提起兴趣,更不用说理解它们的实现细节,所以我选择直接跳过。但是当我们深入学习生成器时,势必要仔细了解这些特性的方方面面。 你或许曾使用过这样的模式: ~~~ function dothings() { setup(); try { // ... 做一些事情 } finally { cleanup(); } } dothings(); ~~~ 清理(cleanup)过程包括关闭连接或文件,释放系统资源,或者只是更新dom来关闭“运行中”的加载动画。我们希望无论任务成功完成与否都触发清理操作,所以执行流入到`finally`代码块。 那么生成器中的清理操作看起来是什么样的呢? ~~~ function* producevalues() { setup(); try { // ... 生成一些值 } finally { cleanup(); } } for (var value of producevalues()) { work(value); } ~~~ 这段代码看起来很好,但是这里有一个问题:我们没在`try`代码块中调用`work(value)`,如果它抛出异常,我们的清理步骤会如何执行呢? 或者假设`for-of`循环包含一条`break`语句或`return`语句。清理步骤又会如何执行呢? 放心,清理步骤无论如何都会执行,ES6已经为你做好了一切。 我们第一次讨论[迭代器和for-of循环](http://www.infoq.com/cn/articles/es6-in-depth-iterators-and-the-for-of-loop)时曾说过,迭代器接口支持一个可选的`.return()`方法,每当迭代在迭代器返回`{done:true}`之前退出都会自动调用这个方法。生成器支持这个方法,`mygenerator.return()`会触发生成器执行任一`finally`代码块然后退出,就好像当前的生成暂停点已经被秘密转换为一条`return`语句一样。 注意,`.return()`方法并不是在所有的上下文中都会被自动调用,只有当使用了迭代协议的情况下才会触发该机制。所以也有可能生成器没执行`finally`代码块就直接被垃圾回收了。 如何在舞台上模拟这些特性?生成器被冻结在一个需要一些配置的任务(例如,建造一幢摩天大楼)中间。突然有人抛出一个错误!`for`循环捕捉到这个错误并将它放置在一遍,她告诉生成器执行`.return()`方法。生成器冷静地拆除了所有脚手架并停工。然后`for`循环取回错误,继续执行正常的异常处理过程。 ## 生成器主导模式 到目前为止,我们在剧本中看到的生成器(generator)和使用者(user)之间的对话非常有限,现在换一种方式继续解释: ![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/2015-10-09_561757eeeea1b.png) 在这里使用者主导一切流程,生成器根据需要完成它的任务,但这不是使用生成器进行编程的唯一方式。 在第1部分中我曾经说过,生成器可以用来实现异步编程,完成你用异步回调或promise链所做的一切。我知道你一定想知道它是如何实现的,为什么yield的能力(这可是生成器专属的特殊能力)足够应对这些任务。毕竟,异步代码不仅产生(yield)数据,还会触发事件,比如从文件或数据库中调用数据,向服务器发起请求并返回事件循环来等待异步过程结束。生成器如何实现这一切?它又是如何不借助回调力量从文件、数据库或服务器中接受数据? 为了开始找出答案,考虑一下如果`.next()`的调用者只有一种方法可以传值返回给生成器会发生什么?仅仅是这一点改变,我们就可能创造一种全新的会话形式: ![](https://docs.gechiui.com/gc-content/uploads/sites/kancloud/2015-10-09_561757ef15c84.png) 事实上,生成器的`.next()`方法接受一个可选参数,参数稍后会作为`yield`表达式的返回值出现在生成器中。那就是说,`yield`语句与`return`语句不同,它是一个只有当生成器恢复时才会有值的表达式。 ~~~ var results = yield getdataandlatte(request.areacode); ~~~ 这一行代码完成了许多功能: * 调用`getdataandlatte()`,假设函数返回我们在截图中看到的字符串“`get me the database records for area code...`”。 * 暂停生成器,生成字符串值。 * 此时可以暂停任意长的时间。 * 最终,直到有人调用`.next({data: ..., coffee: ...})`,我们将这个对象存储在本地变量`results`中并继续执行下一行代码。 下面这段代码完整地展示了这一行代码完整的上下文会话: ~~~ function* handle(request) { var results = yield getdataandlatte(request.areacode); results.coffee.drink(); var target = mosturgentrecord(results.data); yield updatestatus(target.id, "ready"); } ~~~ `yield`仍然保持着它的原始含义:暂停生成器,返回值给调用者。但是确实也发生了变化!这里的生成器期待来自调用者的非常具体的支持行为,就好像调用者是它的行政助理一样。 普通函数则与之不同,通常更倾向于满足调用者的需求。但是你可以借助生成器创造一段对话,拓展生成器与其调用者之间可能存在的关系。 这个行政助理生成器运行器可能是什么样的?它大可不必很复杂,就像这样: ~~~ function rungeneratoronce(g, result) { var status = g.next(result); if (status.done) { return; // phew! } // 生成器请我们去获取一些东西并且 // 当我们搞定的时候再回调它 doasynchronousworkincludingespressomachineoperations( status.value, (error, nextresult) => rungeneratoronce(g, nextresult)); } ~~~ 为了让这段代码运行起来,我们必须创建一个生成器并且运行一次,像这样: ~~~ rungeneratoronce(handle(request), undefined); ~~~ 在之前的文章中,我一个库的示例中提到`Q.async()`,在那个库中,生成器是可以根据需要自动运行的异步过程。`rungeneratoronce`正式这样的一个具体实现。事实上,生成器一般会生成Promise对象来告诉调用者要做的事情,而不是生成字符串来大声告诉他们。 如果你已经理解了Promise的概念,现在又理解了生成器的概念,你可以尝试修改`rungeneratoronce`的代码来支持Promise。这个任务不简单,但是一旦成功,你将能够用Promise线性书写复杂的异步算法,而不仅仅通过`.then()`方法或回调函数来实现异步功能。 # 如何销毁生成器 你是否有看到`rungeneratoronce`的错误处理过程?答案一定是没有,因为上面的示例中直接忽略了错误! 是的,那样做不好,但是如果我们想要以某种方法给生成器报告错误,可以尝试一下这个方法:当有错误产生时,不要继续调用`generator.next(result)`方法,而应该调用`generator.throw(error)`方法来抛出`yield`表达式,进而像`.return()`方法一样终止生成器的执行。但是如果当前的生成暂停点在一个`try`代码块中,那么会`catch`到错误并执行`finally`代码块,生成器就恢复执行了。 另一项艰巨的任务来啦,你需要修改`rungeneratoronce`来确保`.throw()`方法能够被恰当地调用。请记住,生成器内部抛出的异常总是会传播到调用者。所以无论生成器是否捕获错误,`generator.throw(error)`都会抛出`error`并立即返回给你。 当生成器执行到一个`yield`表达式并暂停后可以实现以下功能: * 调用`generator.next(value)`,生成器从离开的地方恢复执行。 * 调用`generator.return()`,传递一个可选值,生成器只执行`finally`代码块并不再恢复执行。 * 调用`generator.throw(error)`,生成器表现得像是`yield`表达式调用一个函数并抛出错误。 * 或者,什么也不做,生成器永远保持冻结状态。(是的,对于一个生成器来说,很可能执行到一个`try`代码块,永不执行`finally`代码块。这种状态下的生成器可以被垃圾收集器回收。) 看起来生成器函数与普通函数的复杂度相当,只有`.return()`方法显得不太一样。 事实上,`yield`与函数调用有许多共通的地方。当你调用一个函数,你就暂时停止了,对不对?你调用的函数取得主导权,它可能返回值,可能抛出错误,或者永远循环下去。 # 结合生成器实现更多功能 我再展示一个特性。假设我们写一个简单的生成器函数联结两个可迭代对象: ~~~ function* concat(iter1, iter2) { for (var value of iter1) { yield value; } for (var value of iter2) { yield value; } } ~~~ es6支持这样的简写方式: ~~~ function* concat(iter1, iter2) { yield* iter1; yield* iter2; } ~~~ 普通`yield`表达式只生成一个值,而`yield*`表达式可以通过迭代器进行迭代生成所有的值。 这个语法也可以用来解决另一个有趣的问题:在生成器中调用生成器。在普通函数中,我们可以从将一个函数重构为另一个函数并保留所有行为。很显然我们也想重构生成器,但我们需要一种调用提取出来的子例程的方法,我们还需要确保,子例程能够生成之前生成的每一个值。`yield*`可以帮助我们实现这一目标。 ~~~ function* factoredoutchunkofcode() { ... } function* refactoredfunction() { ... yield* factoredoutchunkofcode(); ... } ~~~ 考虑一下这样一个场景:一个黄铜机器人将子任务委托给另一个机器人,函数对组织同步代码来说至关重要,所以这种思想可以使基于生成器特性的大型项目保持简洁有序。 ## 退场 好啦,这就是有关生成器的全部内容!我希望你如我般享受,很高兴回来。 下一篇文章,我们会讨论另一种令人兴奋的特性,它是在es6中加入的一种全新的对象,它很微妙,又很复杂,你可能到最后都不知道自己一直在使用这一特性。下一次请记得回来,我们一起深入浅出es6代理(proxy)。
';