泛函编程（34）－泛函变量：处理状态转变

泛函编程的核心模式就是函数组合（compositionality）。实现函数组合的必要条件之一就是参与组合的各方程序都必须是纯代码的（pure code）。所谓纯代码就是程序中的所有表达式都必须是Referentially Transparent（RT，等量可替换的），它的意思是：在一段程序p中，所有的表达式e都可以用e的运算结果替代而不影响到p的运算结果，那么e就是RT等量可替换的，也就是说程序p是由纯代码组成的。但如果程序p中包含了一些变量，这些变量的状态就会影响到程序中e的运算结果，那么p就不再是纯代码了，也就无法保证函数组合的正确性了。所以在泛函编程模式中好像是禁止任何状态变化的（state mutation）。但实际上泛函编程并没有任何明文禁止一个函数内部使用状态转变，所以：如果一个函数f(x)的输入参数x是RT等量可替换的，那么函数f还是个纯函数（pure function）。

为了方便或者提高运算效率，我们往往可能在一个函数内部使用一些变量（local variables）。如果这些变量的状态转变只体现在函数内部，那么对于这个函数的用户来说，这是个纯函数，使用这个函数进行函数组合是没有问题的。我们看看下面的这个例子：

   def quicksort(xs: List[Int]): List[Int] = if (xs.isEmpty) xs else {

     val arr = xs.toArray

     def swap(x: Int, y: Int) = {

       val tmp = arr(x)

       arr(x) = arr(y)

       arr(y) = tmp

     }

     def partition(l: Int, r: Int, pivot: Int) = {

       val pivotVal = arr(pivot)

       swap(pivot, r)

       var j = l

       for (i <- l until r) if (arr(i) < pivotVal) {

         swap(i, j)

         j += 1

       }

       swap(j, r)

       j

     }

     def qs(l: Int, r: Int): Unit = if (l < r) {

       val pi = partition(l, r, l + (r - l) / 2)

       qs(l, pi - 1)

       qs(pi + 1, r)

     }

     qs(0, arr.length - 1)

     arr.toList

   }

 }

以上函数即使使用了while loop, 变量var及可变数组Array，但这些都被限制在函数内部，所以quicksort还是个纯函数。

但是，使用了局部变量后往往迫使代码变得很臃肿。程序变得复杂影响了代码的理解、维护及重复利用。

泛函编程采用的是一种处理变量状态变化的编程语言。在前面我们已经讨论过State Monad，它可以对状态进行读写。State Monad的运作模式是：S => (A,S)，即：传入一个状态S，产生一个新的值及新的状态。对于处理本地状态转变，我们不是要对传入的S进行处理，而是把它作为一种标记让拥有同样标示S的函数可以对变量进行转变。

针对以上需求，一个新的数据类型产生了：ST Monad，我们看看它的定义：

 trait ST[S,A] { self =>

     protected def run(s: S): (A,S)

     def map[B](f: A => B): ST[S,B] = new ST[S,B] {

         def run(s: S) = {

             val (a1,s1) = self.run(s)

             (f(a1),s1)

         }

     }

     def flatMap[B](f: A => ST[S,B]): ST[S,B] = new ST[S,B] {

         def run(s: S) = {

             val (a1,s1) = self.run(s)

             f(a1).run(s1)

         }

     }

 }

 object ST {

     def apply[S,A](a: A): ST[S,A] = {

         lazy val memo = a

         new ST[S,A] {

           def run(s: S) = (memo, s)

         }

     }

 }

这个ST和State基本上一致，只是状态转变函数run不对外开放：protected def run(s: S): (A,S)，这是由于S代表了可以转变状态的权限，我们希望把这个权利局限在ST类内部。ST实现了flatMap，所以是个Monad。

我们希望达到的目的是通过内存参考（memory reference）对变量状态转变进行控制。我们需要实现的方法包括：

分配新的内存单元（memory cell）

读取内存单元数据

存写内存单元数据

ST是个Monad，我们可以制造一个for-comprehension的Monadic语言来进行泛函变量状态转变。我们的变量类型数据结构封装了一个变量：protected var，如下：

 trait STRef[S,A] {

     protected var cell: A

     def read: ST[S,A] = ST(cell)

     def write(a: A): ST[S,Unit] = new ST[S,Unit] {

         def run(s: S) = {

             cell = a

             ((),s)

         }

     }

 }

 object STRef {

     def apply[S,A](a: A): ST[S,STRef[S,A]] = ST(new STRef[S,A] {

         var cell = a

    })

 }

可以看到，STRef的读写访问都返回ST。这使得我们可以用ST Monad语言来描述变量状态转变，如下：

 for {

     r1 <- STRef[Nothing,Int](1)

     r2 <- STRef[Nothing,Int](2)

     x <- r1.read

     y <- r2.read

     _ <- r1.write(y + 1)

     _ <- r2.write(x + 1)

     a <- r1.read

     b <- r2.read

 } yield (a,b)

下一步就是如何运算以上的表达式了。我们希望能安全的运算变量状态转变，那么考虑以下两种ST操作：

ST[S,STRef[S,A]

ST[S,Int]

前面的ST动作包括了一个变量参考，使用者能通过STRef来修改变量，这个操作是不安全的。

ST[S,Int]包含了一个值，所以这个ST动作是安全的。

我们希望借scala的类系统（type system）来帮助我们阻止不安全的ST操作成功编译（compile）。具体实现方式如下：

 trait RunnableST[A] {

     def apply[S]: ST[S,A]

 }

我们先增加一个新的类型RunnableST。把类参数S嵌入在RunnableST类内部的apply方法里。这样可以有效防止new RunnableST[STRef[Nothing,Int]]这样的语句通过编译。再增加一个可以运算ST的函数runST：

 object ST {

     def apply[S,A](a: A): ST[S,A] = {

         lazy val memo = a

         new ST[S,A] {

           def run(s: S) = (memo, s)

         }

     }

   def runST[S,A](rst: RunnableST[A]) =

     rst[Null].run(null)._1

 }

现在我们可以运算变量状态变化描述的程序了：

 val prg = new RunnableST[(Int,Int)] {

   def apply[S] = for {

       r1 <- STRef(1)

       r2 <- STRef(2)

       x <- r1.read

       y <- r2.read

       _ <- r1.write(y+1)

       _ <- r2.write(x+1)

       a <- r1.read

       b <- r2.read

   } yield (a,b)

 }                                                 //> prg  : ch14.ex2.RunnableST[(Int, Int)] = ch14.ex2$$anonfun$main$1$$anon$6@6

                                                   //| 108b2d7

 ST.runST(prg)                                     //> res1: (Int, Int) = (3,2)

我们知道，Array类型也是一种内存参考。我们也可以建一个基于Array的泛函变量数据类型：

 class STArray[S,A] (implicit manifest: Manifest[A]) {

   protected val value: Array[A]

   //array 长度

   def size: ST[S,Int] = ST(value.size)

   //读取array i 位置

   def read(i: Int): ST[S,A] = ST(value(i))

   //将a写入array i 位置

   def write(i: Int, a: A): ST[S,Unit] = new ST[S,Unit] {

       def run(s: S) = {

           value(i) = a

           ((),s)

       }

   }

   //将可变array转换成不可变list

   def freeze: ST[S,List[A]] = ST(value.toList)

   //按照Map的指引，把Map.v写入array Map.k位置

   def fill(xs: Map[Int,A]): ST[S,Unit] =

     xs.foldRight(ST[S,Unit](())) {

       case ((k,v), st) => st flatMap {_ => write(k,v)}

     }

    //array位置i,j内容互换

    def swap(i: Int, j: Int): ST[S,Unit] = for {

     x <- read(i)

     y <- read(j)

     _ <- write(i, y)

     _ <- write(j, x)

   } yield ()

 }

 object STArray {

 //建一个长度为sz,初始值为v的array

     def apply[S,A: Manifest](sz: Int, v: A) = ST(new STArray[S,A] {

         lazy val value = Array.fill(sz)(v)

     })

     //把一个List转成STArray

     def fromList[S,A: Manifest](xs: List[A]): ST[S, STArray[S,A]] = ST(new STArray[S,A] {

         lazy val value = xs.toArray

     })

 }

再看看用STArray的例子：

 object Immutable {

   def noop[S] = ST[S,Unit](())

   def partition[S](a: STArray[S,Int], l: Int, r: Int, pivot: Int): ST[S,Int] = for {

     vp <- a.read(pivot)

     _ <- a.swap(pivot, r)

     j <- STRef(l)

     _ <- (l until r).foldLeft(noop[S])((s, i) => for {

       _ <- s

       vi <- a.read(i)

       _  <- if (vi < vp) (for {

         vj <- j.read

         _  <- a.swap(i, vj)

         _  <- j.write(vj + 1)

       } yield ()) else noop[S]

     } yield ())

     x <- j.read

     _ <- a.swap(x, r)

   } yield x

   def qs[S](a: STArray[S,Int], l: Int, r: Int): ST[S, Unit] = if (l < r) for {

     pi <- partition(a, l, r, l + (r - l) / 2)

     _ <- qs(a, l, pi - 1)

     _ <- qs(a, pi + 1, r)

   } yield () else noop[S]

   def quicksort(xs: List[Int]): List[Int] =

     if (xs.isEmpty) xs else ST.runST(new RunnableST[List[Int]] {

       def apply[S] = for {

         arr    <- STArray.fromList(xs)

         size   <- arr.size

         _      <- qs(arr, 0, size - 1)

         sorted <- arr.freeze

       } yield sorted

   })

 }

从以上的讨论我们了解到：泛函变量状态变化是先用Monadic语言描述状态转变然后通过类系统来实现安全运算的。

泛函编程（34）－泛函变量：处理状态转变－ST Monad的更多相关文章

泛函编程（32）－泛函IO：IO Monad
由于泛函编程非常重视函数组合(function composition),任何带有副作用(side effect)的函数都无法实现函数组合,所以必须把包含外界影响(effectful)副作用不纯代码( ...
泛函编程（27）－泛函编程模式－Monad Transformer
经过了一段时间的学习,我们了解了一系列泛函数据类型.我们知道,在所有编程语言中,数据类型是支持软件编程的基础.同样,泛函数据类型Foldable,Monoid,Functor,Applicative, ...
泛函编程（5）－数据结构（Functional Data Structures)
编程即是编制对数据进行运算的过程.特殊的运算必须用特定的数据结构来支持有效运算.如果没有数据结构的支持,我们就只能为每条数据申明一个内存地址了,然后使用这些地址来操作这些数据,也就是我们熟悉的申明变量 ...
泛函编程（17）－泛函状态－State In Action
对OOP编程人员来说,泛函状态State是一种全新的数据类型.我们在上节做了些介绍,在这节我们讨论一下State类型的应用:用一个具体的例子来示范如何使用State类型.以下是这个例子的具体描述: 模 ...
泛函编程（30）－泛函IO：Free Monad－Monad生产线
在上节我们介绍了Trampoline.它主要是为了解决堆栈溢出(StackOverflow)错误而设计的.Trampoline类型是一种数据结构,它的设计思路是以heap换stack:对应传统递归算法 ...
泛函编程（28）－粗俗浅解：Functor, Applicative, Monad
经过了一段时间的泛函编程讨论,始终没能实实在在的明确到底泛函编程有什么区别和特点:我是指在现实编程的情况下所谓的泛函编程到底如何特别.我们已经习惯了传统的行令式编程(imperative progra ...
泛函编程（38）－泛函Stream IO：IO Process in action
在前面的几节讨论里我们终于得出了一个概括又通用的IO Process类型Process[F[_],O].这个类型同时可以代表数据源(Source)和数据终端(Sink).在这节讨论里我们将针对Proc ...
泛函编程（36）－泛函Stream IO：IO数据源－IO Source & Sink
上期我们讨论了IO处理过程:Process[I,O].我们说Process就像电视信号盒子一样有输入端和输出端两头.Process之间可以用一个Process的输出端与另一个Process的输入端连接 ...
泛函编程（35）－泛函Stream IO：IO处理过程－IO Process
IO处理可以说是计算机技术的核心.不是吗?使用计算机的目的就是希望它对输入数据进行运算后向我们输出计算结果.所谓Stream IO简单来说就是对一串按序相同类型的输入数据进行处理后输出计算结果.输入数 ...

随机推荐

H5常用代码：适配方案5
此方案跟方案4是同一原理,也是通过REM实现的,能单独归类出一个方案,是因为它有一定的实用价值,当你遇到追求完美,追求到一像素的UI或者产品时,那此方案将解决你的困境. 方案5主要是用来解决一像素边框 ...
带你走近AngularJS - 体验指令实例
带你走近AngularJS系列: 带你走近AngularJS - 基本功能介绍带你走近AngularJS - 体验指令实例带你走近AngularJS - 创建自定义指令 ------------- ...
【管理心得之三十二】PMP杂谈---------爱情必胜术
这次一反常态,没有场景设计,我想借此文普及一下PMP是什么? 但我不知道这样枯燥的话题能否能引起你的兴趣,我不得不套用“标题党”<爱情必胜术>来博你眼球. 我真没有说谎,此文是献给那些孤身 ...
javascript中this指向
在简单函数中,this是指向当前对象,可用来获取当前对象某个属性,但随着函数变复杂,this很多情况不指向当前对象,而是指向window. 1.在独立调用函数中,具有全局执行环境,this指向wind ...
在Windows平台上安装Node.js及NPM模块管理
1. 下载Node.js官方Windows版程序:http://nodejs.org/#download 从0.6.1开始,Node.js在Windows平台上提供了两种安装方式,一是.MSI安 ...
Unity 碰撞检测中碰撞器与触发器的区别
要产生碰撞必须为游戏对象添加刚体(Rigidbody)和碰撞器,刚体可以让物体在物理影响下运动.碰撞体是物理组件的一类,它要与刚体一起添加到游戏对象上才能触发碰撞.如果两个刚体相互撞在一起,除非两个对 ...
struts2拦截器
一.自定义拦截器 struts2拦截器类似于servlet过滤器首先定义一个拦截器这个拦截器实现了Interceptor接口: package cn.orlion.interceptor; impo ...
Uvaoj 10048 - Audiophobia（Floyd算法变形）
1 /* 题目大意: 从一个点到达另一个点有多条路径,求这多条路经中最大噪音值的最小值! . 思路:最多有100个点,然后又是多次查询,想都不用想,Floyd算法走起! */ #include< ...
php易混淆知识点
一.define(“constant”, “hello world”);和const constant = “hello world”;的区别? (0).使用const使得代码简单易读,const本 ...
linux分享六：字符串处理
一:cut (1)其语法格式为:cut [-bn] [file] 或 cut [-c] [file] 或 cut [-df] [file] 使用说明cut 命令从文件的每一行剪切字节.字符和字段并将这 ...

泛函编程（34）－泛函变量：处理状态转变－ST Monad

泛函编程（34）－泛函变量：处理状态转变－ST Monad的更多相关文章

随机推荐

热门专题