简单来说:Monad就是泛函编程中最概括通用的数据模型(高阶数据类型)。它不但涵盖了所有基础类型(primitive types)的泛函行为及操作,而且任何高阶类或者自定义类一旦具备Monad特性就可以与任何类型的Monad实例一样在泛函编程中共同提供一套通用的泛函编程方式。所以有人把泛函编程视作Monadic Programming也不为过之。那么,具体什么是Monad呢?

在前面我们讨论过Monoid,我们说过它是一个特殊的范畴(Category),所有数据类型的Monoid实例都共同拥有一套Monoid特有的操作及遵循一套Monoid行为定律。这样我们可以把Monoid视为一个抽象数据模型,在泛函算法中使用特殊的Monoid实例就可以达到预期的效果而不需要修改算法。那么可以说Monad就是一个比Monoid更概括、更抽象、覆盖范畴更广的高阶数据类型了。

实际上在设计泛函库组件(combinator)时,我们会尽量避免重复编码,实现方式就是把通用或共性的操作抽取出来形成一些新的高阶类型(higher types),也就是新的抽象类型(Abstraction)。这样我们可以在不同的组件库中对同类操作共同使用这些通用的类型了。让我们先看看以下的一个抽象过程:

我们在前面讨论过一些数据类型。它们都有一个共同的函数:map

   def map[A,B](la: List[A])(f: A => B): List[B]
def map[A,B](oa: Option[A])(f: A => B): Option[B]
def map[A,B](pa: Par[A])(f: A => B): Par[B]
def map[A,B](sa: State[S,A])(f: A => B): State[S,B]

这几个函数都具有高度相似的款式(signature),不同的是它们施用的具体数据类型。那么我们应该可以把这个map抽象出来:通过增加一个高阶类型Functor,用它来概括实现map:

   trait Functor[F[_]] {
def map[A,B](a: F[A])(f: A => B): F[B]
}

注意在上面的map例子里的施用类型都是高阶类型;List[A]、Option[A]、Par[A] ...都是F[A]这种形式。所以Functor的类参数是F[_],即: Functor[List], Functor[Option], Functor[Par] ...,这里面F[_]就是F[A],A可以是任何类型。我们可以设计一个List的Functor实例:

   object ListFunctor extends Functor[List] {
def map[A,B](la: List[A])(f: A => B): List[B] = la map f
}

把F换成List就可以了。其它类型的Functor实例:

  object OptionFunctor extends Functor[Option] {
def map[A,B](oa: Option[A])(f: A => B): Option[B] = oa map f
}
object StreamFunctor extends Functor[Stream] {
def map[A,B](sa: Stream[A])(f: A => B): Stream[B] = sa map f
}

我们只需要对不同类型的操作使用对应的Functor实例就可以了:

 ListFunctor.map(List(1,2,3)){_ + 10}             //> res0: List[Int] = List(11, 12, 13)
OptionFunctor.map(Some(1)){_ + 10} //> res1: Option[Int] = Some(11)

操作模式是一致相同的。不过讲实在话,上面的这些实例都没什么意义,因为施用的具体类型本身就支持map。也就是说List,Option等本身就是Functor。换句话讲就是:它们都可以map,所以都是Functor。看看下面怎么使用Functor吧:

   trait Functor[F[_]] {
def map[A,B](a: F[A])(f: A => B): F[B]
def unzip[A,B](fab: F[(A,B)]): (F[A],F[B]) = {
(map(fab){a => a._1},map(fab){a => a._2})
}
}

在这个例子中我特意把整个trait申明放了进去。这里的map还是抽象的,意味着还需要在具体的类型实例里实现。我们在设计unzip时是针对F的。在trait Functor里我们可以肯定F[(A,B)]支持map,所以我们才可以完成unzip函数的实现。这就是抽象的作用。当我们使用unzip时只要确定传入的参数fab是Functor就行了。这样unzip可以支持所有封装(A,B)的Functor:

 ListFunctor.unzip(List((1,10),(2,20),(3,30)))    //> res0: (List[Int], List[Int]) = (List(1, 2, 3),List(10, 20, 30))
OptionFunctor.unzip(Some((1,2))) //> res1: (Option[Int], Option[Int]) = (Some(1),Some(2))

讲到这里,这个Functor跟Monad有什么关系吗?不过这种抽象的目的和模式可能跟Monad有什么关联吧?那么再往下推导:在之前的数据类型设计里我们曾想碰到很多map2函数:

  def map2[A,B,C](la: List[A], lb: List[B])(f: (A,B) => C): List[C] = {
la flatMap {a => lb map { b => f(a,b) }}
}
def map2[A,B,C](oa: Option[A], ob: Option[B])(f: (A,B) => C): Option[C] = {
oa flatMap{a => ob map { b => f(a,b) }}
}
def map2[A,B,C](pa: Par[A], pb: Par[B])(f: (A,B) => C): Par[C] = {
pa flatMap{a => pb map { b => f(a,b) }}
}

看看这些map2函数:不但款式相同,实现方法也是相同的。不同的还是具体施用受体的数据类型。看来我们还是因为各种数据类型的不同而重复编写了map2组件。我们应该想办法一次实现map2后让所有数据类型实例都可以使用,从而彻底避免重复编码。可以肯定的是这些办法一定跟共性抽象有关。

在前面那些章节的讨论中我们一直针对某些数据类型的特性设计最基本的操作函数或组件。因为各种数据类型的不同我们重复编写了map2组件。现在我们看到map2是可以用flatMap和map来实现的。那么flatMap和map就是最基本最通用的组件了吗?事实上map可以用flatMap和unit来实现:

   def map[A,B](pa: Par[A])(f: A => B): Par[B] = {
flatMap(pa) { a => unit(f(a)) }
}

那么我们就先选择unit + flatMap作为最基本组件。当然,从前面的推导中我们可以得出unit + flatMap基本组件比Functor更抽象(更概括),因为map可以用unit + flatMap来实现。我们称这个抽象模型为Monad,它继承了Functor的特性,是Functor,因为Monad可以map。我们可以先用trait来表达Monad:

  trait Monad[M[_]] extends Functor[M] {
def unit[A](a: A): M[A]
def flatMap[A,B](ma: M[A])(f: A => M[B]): M[B]
def map[A,B](ma: M[A])(f: A => B): M[B] = {
flatMap(ma){a => unit(f(a))}
}
def map2[A,B,C](ma: M[A], mb: M[B])(f: (A,B) => C): M[C] = {
flatMap(ma) { a => map(mb){ b => f(a,b) }}
}
}

在这个trait里unit和flatMap是抽象的。这意味着各类型的Monad实例必须实现unit和flatMap,并且会自动获取map和map2两个组件。

  val listMonad = new Monad[List] {
def unit[A](a: A) = List(a)
def flatMap[A,B](la: List[A])(f: A => List[B]): List[B] = {
la flatMap f
}
} //> listMonad : ch11.monad.Monad[List] = ch11.monad$$anonfun$main$1$$anon$1@253
//| 0c12 listMonad.map(List(1,2,3)){_ + 10} //> res0: List[Int] = List(11, 12, 13)
listMonad.map2(List(1,2),List(3,4)){(a,b) => List(a,b)}
//> res1: List[List[Int]] = List(List(1, 3), List(1, 4), List(2, 3), List(2, 4))
//|

的确我们从listMonad中自动获得了可用的map和map2.

optionMonad是这样的:

  val optionMonad = new Monad[Option] {
def unit[A](a: A) = Some(a)
def flatMap[A,B](oa: Option[A])(f: A => Option[B]): Option[B] = {
oa flatMap f
}
} //> optionMonad : ch11.monad.Monad[Option]{def unit[A](a: A): Some[A]} = ch11.m
//| onad$$anonfun$main$1$$anon$2@4e04a765
optionMonad.map(Some(1)){a => a + 10} //> res2: Option[Int] = Some(11)
optionMonad.map2(Some(1),Some(2)){_ + _} //> res3: Option[Int] = Some(3)

现在我们似乎可以说任何可以flatMap(具备flatMap函数)的数据类型都是Monad。

我们可以再丰富一下现在的Monad组件库,增加多些共用组件,使Monad抽象模型能更概括实用些:

   trait Monad[M[_]] extends Functor[M] {
def unit[A](a: A): M[A]
def flatMap[A,B](ma: M[A])(f: A => M[B]): M[B]
def map[A,B](ma: M[A])(f: A => B): M[B] = {
flatMap(ma){a => unit(f(a))}
}
def map2[A,B,C](ma: M[A], mb: M[B])(f: (A,B) => C): M[C] = {
flatMap(ma) { a => map(mb){ b => f(a,b) }}
}
def sequence[A](lm: List[M[A]]): M[List[A]] = {
lm.foldRight(unit(Nil: List[A])){(a,b) => map2(a,b){_ :: _} }
}
def travers[A,B](la: List[A])(f: A => M[B]): M[List[B]] = {
la.foldRight(unit(Nil: List[B])){(a,b) => map2(f(a),b){_ :: _}}
}
def replicateM[A](n: Int, ma: M[A]): M[List[A]] = {
if (n == 0) unit(Nil)
else map2(ma,replicateM(n-1,ma)) {_ :: _}
}
def factor[A,B](ma: M[A], mb: M[B]): M[(A,B)] = {
map2(ma,mb){(a,b) => (a,b)}
}
def cofactor[A,B](e: Either[M[A],M[B]]): M[Either[A,B]] = {
e match {
case Right(b) => map(b){x => Right(x)}
case Left(a) => map(a){x => Left(x)}
}
}
}

可以看出,我们新增加的组件都是以unit + flatMap这两个基础组件实现的,都是更高阶的组件。所以是不是可以说Monadic programming 就是 flatMap Programming呢?

泛函编程(23)-泛函数据类型-Monad的更多相关文章

  1. 泛函编程(5)-数据结构(Functional Data Structures)

    编程即是编制对数据进行运算的过程.特殊的运算必须用特定的数据结构来支持有效运算.如果没有数据结构的支持,我们就只能为每条数据申明一个内存地址了,然后使用这些地址来操作这些数据,也就是我们熟悉的申明变量 ...

  2. 备份-泛函编程(23)-泛函数据类型-Monad

    泛函编程(23)-泛函数据类型-Monad http://www.cnblogs.com/tiger-xc/p/4461807.html https://blog.csdn.net/samsai100 ...

  3. 泛函编程(25)-泛函数据类型-Monad-Applicative

    上两期我们讨论了Monad.我们说Monad是个最有概括性(抽象性)的泛函数据类型,它可以覆盖绝大多数数据类型.任何数据类型只要能实现flatMap+unit这组Monad最基本组件函数就可以变成Mo ...

  4. 泛函编程(24)-泛函数据类型-Monad, monadic programming

    在上一节我们介绍了Monad.我们知道Monad是一个高度概括的抽象模型.好像创造Monad的目的是为了抽取各种数据类型的共性组件函数汇集成一套组件库从而避免重复编码.这些能对什么是Monad提供一个 ...

  5. 泛函编程(34)-泛函变量:处理状态转变-ST Monad

    泛函编程的核心模式就是函数组合(compositionality).实现函数组合的必要条件之一就是参与组合的各方程序都必须是纯代码的(pure code).所谓纯代码就是程序中的所有表达式都必须是Re ...

  6. 泛函编程(32)-泛函IO:IO Monad

    由于泛函编程非常重视函数组合(function composition),任何带有副作用(side effect)的函数都无法实现函数组合,所以必须把包含外界影响(effectful)副作用不纯代码( ...

  7. 泛函编程(30)-泛函IO:Free Monad-Monad生产线

    在上节我们介绍了Trampoline.它主要是为了解决堆栈溢出(StackOverflow)错误而设计的.Trampoline类型是一种数据结构,它的设计思路是以heap换stack:对应传统递归算法 ...

  8. 泛函编程(28)-粗俗浅解:Functor, Applicative, Monad

    经过了一段时间的泛函编程讨论,始终没能实实在在的明确到底泛函编程有什么区别和特点:我是指在现实编程的情况下所谓的泛函编程到底如何特别.我们已经习惯了传统的行令式编程(imperative progra ...

  9. 泛函编程(27)-泛函编程模式-Monad Transformer

    经过了一段时间的学习,我们了解了一系列泛函数据类型.我们知道,在所有编程语言中,数据类型是支持软件编程的基础.同样,泛函数据类型Foldable,Monoid,Functor,Applicative, ...

随机推荐

  1. spring中配置了事务,数据业务层捕获异常,事务配置不成功?

    原理:spring aop  异常捕获原理:被拦截的方法需显式抛出异常,并不能经任何处理,这样aop代理才能捕获到方法的异常,才能进行回滚,默认情况下aop只捕获runtimeexception的异常 ...

  2. MySQL HA方案之MySQL半复制+MHA+Keepalived+Atlas+LVS[转]

    MySQL HA方案之MySQL半复制+MHA+Keepalived+Atlas+LVS 简介 目前Mysql高可用的方案有好多,比如MMM,heartbeat+drbd,Cluster等,还有per ...

  3. java之接口interface

    接口 1.多个无关的类可以实现同一个接口 2.一个类可以实现多个无关的接口 3.与继承关系类似,接口与实现类之间存在多态性 4.定义java类的语法格式 < modifier> class ...

  4. POJ 1330 Nearest Common Ancestors

    Nearest Common Ancestors Time Limit: 1000MS   Memory Limit: 10000K Total Submissions: 14698   Accept ...

  5. 获取全国市以及地理坐标,各大坐标系北斗,百度,WGS-84坐标系的转换,有图,有代码

    1 先上坐标取到的值: 获取到的坐标部分如下: '北京市':[116.39564503788,39.92998577808], '天津市':[117.21081309155,39.1439299033 ...

  6. [原]SQLite的学习系列之获取数据库版本

    最先了解到SQLite是基于其作为移动客户端数据存储平台,以下是其官网(https://www.sqlite.org/)关于SQLite的一段介绍: SQLite是遵守ACID的轻型数据库引擎,它包含 ...

  7. 转:C/C++内存管理详解 堆 栈

    http://chenqx.github.io/2014/09/25/Cpp-Memory-Management/ 内存管理是C++最令人切齿痛恨的问题,也是C++最有争议的问题,C++高手从中获得了 ...

  8. 九度OJ 1502 最大值最小化(JAVA)

    题目1502:最大值最小化(二分答案) 九度OJ Java import java.util.Scanner; public class Main { public static int max(in ...

  9. 使用hessian+protocol buffer+easyUI综合案例--登陆

    首先先简单介绍下hessian ,protocol buffer, easyUI框架 hessian: Hessian是一个轻量级的remoting on http工具,采用的是Binary RPC协 ...

  10. 【转】How to resolve ORA-19706 error when select from dblink

    文章转自:http://www.dbform.com/html/2012/1846.html