写点什么

Scala 中的函数式特性

2016 年 6 月 14 日

Scala 作为最有意思的编程语言之一,其中一等公民函数具有哪些特性呢?本文整理自 ArchSummit 微课堂:Scala 布道师、挖财资深架构师王宏江老师的分享内容。ArchSummit 交流体验群定期邀请业内大牛线上直播分享技术干货,加群方式见文章底部。

有一篇以调侃的口气评述各种编程语言史的文章里面说到:“2003 年,一个叫 Martin Odersky 的醉汉看见了好时瑞森花生酱杯的广告,展示了某个人的花生酱倒入另一个人的巧克力的场景,他忽然有了个点子,创造了 Scala,一种结合了面向对象和函数式编程的语言。这同时激怒了两个阵营的忠实信徒,他们立刻宣布要发动圣战烧死异教徒。”

这句调侃很有意思,它折射出这两种编程风格互相格格不入,所以尝试把这两种风格结合起来也是一种开创,当然注定了一开始就会存在争议。但争议归争议,我们作为工程人员最主要的还是看重它解决问题的能力,而当前来看 Scala 无疑已经算是比较成功的编程语言了。

这次跟大家交流一下 Scala 里的一些函数式特性,关于函数式特性这个话题比较大,这次时间很有限,我不知道能聊到多少内容,尽量抛出一些能引发大家思考的东西。编程语言分很多种范式,其中大家熟悉的有命令式 (也称指令式) 与函数式这两种范式。而这两种编程范式追溯起来是由这两位先贤确定的:

上图中,左边跑步的年轻小伙是图灵,右边年老一点的是阿隆佐邱奇。八卦一下,图灵也是个长跑健将,在学院期间经常早起先跑个半程马拉松;阿隆佐邱奇也是图灵在普林斯顿的老师,所以上世纪的普林斯顿的先贤们奠定了整个计算机领域的发展。

图灵机,以及冯诺依曼对它的实现(冯诺依曼体系),从风格上被归为“命令式”,它的运算过程可以看作不断地修改内存来反映运算的结果,即用命令修改状态;而阿隆佐邱奇提出的 Lambda 演算,则是通过连续的运算(基于函数)得到最终结果。

基于 Lambda 演算的被归为函数式,在众多的函数式编程语言里,Scala 的血缘继承自 ML 和 Haskell 最多。关于 ML 有本非常好的书《ML for the Working Programmer》,这本书里面提到:“函数式程序是跟值打交道的,而不是跟状态打交道的。它们的工具是表达式,而不是命令。”

那么,我们先要了解一下这里说的“表达式”以及 Scala 里的表达式与 Java 有什么不同。在 Scala 里,所有的表达式都有值(继承自 ML)。举个例子,a = 1 是一段赋值表达式,但这个表达式有其自身的结果,它是一个 Unit 类型的结果,还有 if else,try catch 甚至 throw Exception 等表达式,它们也都有结果。其中赋值语句的返回值问题跟 Java 里有很大的差异,我们来比较一下,Java 里:

复制代码
int a,b,c;
a = b = c = 1;

这样是没有问题的。

而 Scala 里则会出错,类型不匹配,因为 c = 0 这个表达式的结果是 Unit 类型,再把它赋值给 b 的时候类型不对。

特别典型的,我们在 Java 里逐行读取一段文本

复制代码
while( (line = readLine() ) != null ) {
}

这里期望是每次读取一行内容赋值给 line 变量,并判断 line 不为 null,在 Java 里没有问题,但 Scala 里 line = readLine() 这个赋值表达式的结果是一个 Unit 类型的值,导致永远不为 null。而对于 {…} 这种代码块,也是一个表达式,它由若干表达式组合,最后一个表达式的值是它的值。先一定弄清楚这个差异,接下来我们谈函数的内容:

狭义地区分 (从可传递性上) 方法 (method):

指的是在 trait/class/object 中以 def 关键字声明的, 它不能被直接传递。函数 (function) 类型为 ParamsType=>ResultType 的变量, 这些变量背后是用 FuncfonN 对象来封装的 ; 可以被传递。方法可以转换为函数。

广义上,抛开背后的实现,方法就是函数,编译器某些场景自动把方法封装为一个函数对象来传递。Scala 社区并不特别区分这两个名词,注意语境,有时候函数就是指方法,有时候则是指函数对象。

函数作为一等公民体现在哪儿? 这里简单介绍一些特性:

1) 可传递 / 赋值

2) 嵌套函数和匿名函数

3) 高阶

4) 偏应用 (partial application)

5) 闭包

可传递性即函数可以像值一样被传来传去。

或者显式的定义一个函数值:

嵌套函数则是可以在函数内部再声明函数:

嵌套函数应用场景并不多, 其中一个场景是将递归函数的转为尾递归方式。

匿名函数或 lambda 表达式也称函数字面量 (function literal):

高阶函数则是接受另一个函数做参数,或者返回的而结果是一个函数:

在 lambda 演算中,每个表达式都代表一个只有单独参数的函数,这个函数的参数本身也是一个只有单一参数的函数,同时函数的值是又一个只有单一参数的函数。

那么问题来了:多个参数的函数怎么办?

上面就是一个例子,把两个参数的函数通过柯里化转换为接受一个参数。它有点像一个函数链,把一个带有多个参数的函数转换为多个只有一个参数的函数来执行。

柯理化的实际用途?

1) 控制抽象, 可改变代码的书写风格:

2) 实现部分应用函数。部分应用函数 (partial application function) 把一个函数适配为另一个函数,举例来看:

然后看一下闭包,先回顾一下 Java 里的匿名内部类:

疑问:innerVar 还是分配在栈空间上么?

那么闭包简单来说就是一段行为,以及它的上下文。

这个方法返回了一个闭包 (一段 lambda 实例),这个闭包里引用到了局部的变量 localVal。闭包有很多问题都是引用环境的绑定 (The Binding of Referencing Environments) 所产生的。

一个 JavaScript 的例子

解决方式:多一层抽象

其实上面的解决方式里又涉及另一个话题:参数的传递方式,这里不讲了。当然闭包的绑定问题,还有高阶的话题,比如在递归情况下引用环境约束又是怎样的。

这个留给大家再进一步挖掘了。

最后简单说一点类型系统里的 lambda,在 Scala 里 generic types as first-class types,在类型系统上跟 Java 比有非常大的差异,它支持高阶特性。

我们从多态的层面来看,除了继承 / 子类型方式,还有泛型 / 参数化类型也可以实现多态。在 Java 里的泛型是在 Java5 才支持的(作者也是 Scala 的作者 Martin),所以它有一些历史包袱:比如 List 这个类型,T 是类型参数,在 Java 里只能支持普通的类型参数,在 Scala 里写法不同:

那现在,如果对 T 这个参数再进一步抽象,它如果也是一个 type constructor 会如何呢?

Java : class List2<C> {} // 不支持

Scala: class List2[C[T]]

不要小看这点差异,这是类型系统层面巨大的不同。它把类型的抽象层次一下提升了一个级别,对类型简单地归纳:

类型是对数据的抽象

那对类型再抽象呢?又叫什么?

Kind: 类别, 对类型的抽象

所有的 proper type 被抽象为同一种 kind,用 * 表示:

以函数的视角:

Scala 的类型系统是图灵完备的,即利用类型系统本身就可以解决一些问题。

时间比较紧,先分享这些东西。可能不太好消耗,希望这个分享对大家有所启发,对 Scala 的抽象有更深的理解。

问题 1:请问初始学习 Scala, 看那些书比较好.?

先推荐这本《Scala 程序设计:Java 虚拟机多核编程实战 》,面向初学者。然后 Martin 自己写的《Programming in Scala》内容非常充实,是最好的一本教材需要细读,现在可能有第三版了,中文版只有第一版。

还有《快学 Scala》也值得一看。

最后《Scala 函数式编程》这本书面向高阶特性,介绍了包括 fuctor, monad 等函数式概念

问题 2:C 语言工程师要想 转做 Scala 继续学习补充哪些知识呢?

对于 C 的人,转 Scala 的话,可能先把 Java 的特性弄熟更有利,Scala 基于 JVM 平台,能先用起来解决实际问题,自然就能不断进步了。

问题 3:Scala 究竟是简单还是困难呢?和 C++ 相比的有缺点在哪了?

如果你把 Scala 当作 Java 来用,并不复杂,不需要消化它的高阶特性,可以很快上手。有很多人将 Scala 和 C++ 相比,我没有 C++ 方面的背景,很难回答。

Scala 的复杂度主要是类型系统层面的,可以说是 Haskell 的影响,主要在思维方式的差异性上,对程序员有较大冲击。

问题 4:Scala 在程序排行榜中所占比例不太好的原因是什么呢?

很多理论都是从学院界逐渐转入工业界的,大众程序员对函数式的理解现在也不够普及,这需要一个过程。

问题 5:请问在推广使用 Scala 方面有什么好的建议?

先解决实际问题,业务用起来了自然就推动了。

问题 6:Scala 的闭包和 Node.js 的闭包差异在什么地方呢?

在上下文绑定问题上没有差异。至于各种语言 / 平台,闭包在底层用什么方式来承载,我不好说。在 Scala 里闭包就是一个 FunctionN 的类型,背后还是用对象来承载的。

问题 7:命令式编程和函数式编程之间各有什么利弊?

看场景,命令式程序比较直接,容易理解。

函数式在并发场景更有用武之地。

ArchSummit 交流体验群

大会很期待?线上解解馋—— ArchSummit 给求知若渴的你,微信搜索公众号:ArchSummit ,关注 ArchSummit 微信公众平台获取更多技术干货,及时了解大会进展,并可以提前参与大会讲师的线上分享和交流活动。

Cloudera、Hearsay Social、Uber、LinkedIn、Twitter……你将为哪家公司技术点赞?阿里巴巴、腾讯、百度、美团、饿了么、滴滴、新浪微博……核心业务技术较量谁又能触动你的神经…最精彩的技术切磋从这开始, ArchSummit 全球架构师峰会2016 深圳站, 9 折售票最后一周,详情点击这里。购票热线:010-89880682 。

2016 年 6 月 14 日 17:053661

评论

发布
暂无评论
发现更多内容

第7周作业

方堃

第六周总结

Acker飏

第六周总结

考尔菲德

极客大学架构师训练营-本周总结

Geek_zhangjian

案例研究之聊聊Mybatis源码(一)

小诚信驿站

刘晓成 聊聊架构 开源框架Mybatis ORM框架 小诚信驿站

学习总结

李朋

分布式数据库设计中关键几点

dony.zhang

CAP原理

架构师训练营第6周心得

方堃

作业 - 第6周

Happy-Coming

架构师课作业 - 第六周

Tulane

Lesson 6 分布式系统架构-分布式数据库、NoSql、ZooKeeper -心得笔记

edd

week6 总结

雪涛公子

第六周作业

CP

LeetCode题解:15. 三数之和,JavaScript双循环+双指针,详细注释

Lee Chen

LeetCode 前端进阶训练营

分布式数据库

ruettiger

可读代码编写炸鸡五 - 教练,我想要来到第二层

多选参数

代码组织 代码规范 可读代码编写 可读代码

week06 学习总结

Safufu

架构师训练营 No.6 周总结

连增申

架构师训练营week6作业1

平淡人生

架构师0期第六周命题作业

何伟敏

架构师 0 期第六周总结

何伟敏

架构师训练营第六周学习总结

Bruce Xiong

Week06作业

uangguan

如何设计一个公司级别的消息通知系统?

诸葛小猿

kafka 通知系统 mqtt

架构师训练营 No.6 周作业

连增申

CAP定理的理解

考尔菲德

WEEK6-作业-对CAP理解

蒜泥精英

WEEK6-学习心得

蒜泥精英

CAP原理简述

ruettiger

Week06总结

uangguan

架构师训练营 - 第六课作业 -20200715- CAP与DORIS

👑👑merlan

架构是训练营 CAP

演讲经验交流会|ArchSummit 上海站

演讲经验交流会|ArchSummit 上海站

Scala中的函数式特性-InfoQ