[Erlang 0128] Term sharing in Erlang/OTP 下篇

继续昨天的话题,昨天提到io:format对数据共享的间接影响,如果是下面两种情况恐怕更容易成为"坑", 呃,恰好我都遇到过;

如果是测试代码是下面这样,得到的结果会是怎样?猜!

s2()->

  L=[1,2,3,4,5,6],

  L2=[L,L,L,L],

erlang:display( {{erts_debug:size(L),erts_debug:flat_size(L)},{erts_debug:size(L2),erts_debug:flat_size(L2)}}

).

结果是

5> d:s2().

{{12,12},{56,56}}

这个结果出来之后,我足足用了5分钟用来怀疑人生,为什么和期望的结果不一样呢?是因为我现在用的最新版本(17.2)吗?是实现已经修改掉但是没有更新文档吗?出于好奇,我还是按照之前探索问题的套路,生成了一下to_core文件,真相大白:

's2'/0 =

    %% Line 11

    fun () ->

        let <_cor5> =

            %% Line 14

            call 'erts_debug':'size'

                ([1|[2|[3|[4|[5|[6]]]]]])

        in  let <_cor4> =

                %% Line 14

                call 'erts_debug':'flat_size'

                    ([1|[2|[3|[4|[5|[6]]]]]])

            in  let <_cor3> =

                    %% Line 14

                    call 'erts_debug':'size'

                        ([[1|[2|[3|[4|[5|[6]]]]]]|[[1|[2|[3|[4|[5|[6]]]]]]|[[1|[2|[3|[4|[5|[6]]]]]]|[[1|[2|[3|[4|[5|[6]]]]]]]]]])

                in  let <_cor2> =

                        %% Line 14

                        call 'erts_debug':'flat_size'

                            ([[1|[2|[3|[4|[5|[6]]]]]]|[[1|[2|[3|[4|[5|[6]]]]]]|[[1|[2|[3|[4|[5|[6]]]]]]|[[1|[2|[3|[4|[5|[6]]]]]]]]]])

                    in  %% Line 14

                        call 'erlang':'display'

                            ({{_cor5,_cor4},{_cor3,_cor2}})

修改一下代码:

s3(L)->

    L2=[L,L,L,L],

    {{erts_debug:size(L),erts_debug:flat_size(L)},{erts_debug:size(L2),erts_debug:flat_size(L2)}}

.

对应的s3的代码是

's3'/1 =

    %% Line 18

    fun (_cor0) ->

        let <L2> =

            %% Line 19

            [_cor0|[_cor0|[_cor0|[_cor0|[]]]]]

        in  let <_cor5> =

                %% Line 20

                call 'erts_debug':'size'

                    (_cor0)

            in  let <_cor4> =

                    %% Line 20

                    call 'erts_debug':'flat_size'

                        (_cor0)

                in  let <_cor3> =

                        %% Line 20

                        call 'erts_debug':'size'

                            (L2)

                    in  let <_cor2> =

                            %% Line 20

                            call 'erts_debug':'flat_size'

                                (L2)

                        in  %% Line 20

                            {{_cor5,_cor4},{_cor3,_cor2}}

换句话,在编译阶段s2方法里面的常量数据就已经展开了,所以L2无论是size还是flat_size都是一样的.之所以要先把这个测试做了,就是避免后面的测试误入陷阱.

这个怎么破呢?除了上面传入参数的方法之外,还有一个路子:换成函数调用即可,如下:

s4()->

  L=lists:seq(1,6),

  L2=[L,L,L,L],

erlang:display( {{erts_debug:size(L),erts_debug:flat_size(L)},{erts_debug:size(L2),erts_debug:flat_size(L2)}}

).

对应的代码为:

's4'/0 =

    %% Line 24

    fun () ->

        let <L> =

            %% Line 25

            call 'lists':'seq'

                (1, 6)

        in  let <L2> =

                %% Line 26

                [L|[L|[L|[L|[]]]]]

            in  let <_cor5> =

                    %% Line 27

                    call 'erts_debug':'size'

                        (L)

                in  let <_cor4> =

                        %% Line 27

                        call 'erts_debug':'flat_size'

                            (L)

                    in  let <_cor3> =

                            %% Line 27

                            call 'erts_debug':'size'

                                (L2)

                        in  let <_cor2> =

                                %% Line 27

                                call 'erts_debug':'flat_size'

                                    (L2)

                            in  %% Line 27

                                call 'erlang':'display'

                                    ({{_cor5,_cor4},{_cor3,_cor2}})

不要小看这个问题,这样一个常量优化在极端情况下会有"大惊喜",论文里面给了这样一个例子:

show_compiler_crashes() ->

L0 = [0],

L1 = [L0, L0, L0, L0, L0, L0, L0, L0, L0, L0],

L2 = [L1, L1, L1, L1, L1, L1, L1, L1, L1, L1],

L3 = [L2, L2, L2, L2, L2, L2, L2, L2, L2, L2],

L4 = [L3, L3, L3, L3, L3, L3, L3, L3, L3, L3],

L5 = [L4, L4, L4, L4, L4, L4, L4, L4, L4, L4],

L6 = [L5, L5, L5, L5, L5, L5, L5, L5, L5, L5],

L7 = [L6, L6, L6, L6, L6, L6, L6, L6, L6, L6],

L8 = [L7, L7, L7, L7, L7, L7, L7, L7, L7, L7],

L9 = [L8, L8, L8, L8, L8, L8, L8, L8, L8, L8],

L = [L9, L9, L9, L9, L9, L9, L9, L9, L9, L9],

L.

影响有多大呢?看结果:

After a bit more of 45 minutes of struggling, the compiler tries to allocate 3.7 GB of memory and gives up:

$ erlc demo.erl
Crash dump was written to: erl_crash.dump
eheap_alloc: Cannot allocate 3716993744 bytes of
memory (of type "heap_frag").
Abort

好吧,勇于自黑,由于上面遇到这样让人恼火的问题,我决定在Shell中完成后续的测试,然后,我一脚踏进"新坑":

陷阱2 Shell ! Shell !

Eshell V6.0  (abort with ^G)

1> L=[1,2,3,4,5,6,7,8,9,10].

[1,2,3,4,5,6,7,8,9,10]

2>  L2=[L,L,L,L,L,L].

[[1,2,3,4,5,6,7,8,9,10],

[1,2,3,4,5,6,7,8,9,10],

[1,2,3,4,5,6,7,8,9,10],

[1,2,3,4,5,6,7,8,9,10],

[1,2,3,4,5,6,7,8,9,10],

[1,2,3,4,5,6,7,8,9,10]]

3> erts_debug:size(L2).

32

4> erts_debug:flat_size(L2).

132

5> io:format("~p",[L2]).

[[1,2,3,4,5,6,7,8,9,10],

[1,2,3,4,5,6,7,8,9,10],

[1,2,3,4,5,6,7,8,9,10],

[1,2,3,4,5,6,7,8,9,10],

[1,2,3,4,5,6,7,8,9,10],

[1,2,3,4,5,6,7,8,9,10]]ok

6> erts_debug:size(L2).

32

7> erts_debug:flat_size(L2).

132

一开始启动shell的时候,Shell的Pid是<0.33.0>.然后我们在中间故意执行一个不存在的方法 fake:fake().这时查看一下,Shell已经重启,Pid变成<0.40.0>.注意再执行erts_debug:size(L2).结果已经变成了132了,换句话说,这里L2数据已经展开了.

Eshell V6.0  (abort with ^G)

1> self().

<0.33.0>

2>  L=[1,2,3,4,5,6,7,8,9,10].

[1,2,3,4,5,6,7,8,9,10]

3>  L2=[L,L,L,L,L,L].

[[1,2,3,4,5,6,7,8,9,10],

[1,2,3,4,5,6,7,8,9,10],

[1,2,3,4,5,6,7,8,9,10],

[1,2,3,4,5,6,7,8,9,10],

[1,2,3,4,5,6,7,8,9,10],

[1,2,3,4,5,6,7,8,9,10]]

4>  erts_debug:size(L2).

32

5> erts_debug:flat_size(L2).

132

6> fake:fake().

** exception error: undefined function fake:fake/0

7> self().

<0.40.0>

8>  erts_debug:size(L2).

132

9> erts_debug:flat_size(L2).

132

10>

那为什么会触发数据展开(expand ,flattening)呢? 看下面的代码,在Shell启动的时候,会把之前已经绑定的变量作为spawn_link参数以启动新的shell.

erl6.2\lib\stdlib-2.2\src

start_eval(Bs, RT, Ds) ->

    Self = self(),

    Eval = spawn_link(fun() -> evaluator(Self, Bs, RT, Ds) end),

    put(evaluator, Eval),

    Eval.

换句话说,Erlang中使用spawn创建进程,传入的参数(包括函数闭包),需要拷贝到新进程的heap,换句话说进程创建的时候需要考虑参数的大小.

OK,这个问题差不多了,休息.

[Erlang 0128] Term sharing in Erlang/OTP 下篇的更多相关文章

[Erlang 0127] Term sharing in Erlang/OTP 上篇
之前,在 [Erlang 0126] 我们读过的Erlang论文提到过下面这篇论文: On Preserving Term Sharing in the Erlang Virtual Machine ...
[Erlang 0121] 当我们谈论Erlang Maps时,我们谈论什么 Part 3
Erlang/OTP 17.0 has been released http://www.erlang.org/download/otp_src_17.0.readme Erlang/OTP ...
[Erlang 0116] 当我们谈论Erlang Maps时,我们谈论什么 Part 1
Erlang 增加 Maps数据类型并不是很突然,因为这个提议已经进行了2~3年之久,只不过Joe Armstrong老爷子最近一篇文章Big changes to Erlang掀起不小了风 ...
Erlang基础 -- 介绍 -- 历史及Erlang并发
前言最近在总结一些Erlang编程语言的基础知识,拟系统的介绍Erlang编程语言,从基础到进阶,然后再做Erlang编程语言有意思的库的分析. 其实,还是希望越来越多的人关注Erlang,使用Er ...
[Erlang 0117] 当我们谈论Erlang Maps时,我们谈论什么 Part 2
声明:本文讨论的Erlang Maps是基于17.0-rc2,时间2014-3-4.后续Maps可能会出现语法或函数API上的有所调整,特此说明. 前情提要: [Erlang 0116] 当我们谈论E ...
学习:erlang的term反序列化，string转换为term
一. string_to_term(String) -> case erl_scan:string(String++".") of {ok, Tokens ...
[Erlang 0125] Know a little Erlang opcode
Erlang源代码编译为beam文件,代码要经过一系列的过程(见下面的简图),Core Erlang之前已经简单介绍过了Core Erlang,代码转换为Core Erlang,就容易拨开一些语法糖的 ...
[Erlang 0109] From Elixir to Erlang Code
Elixir代码最终编译成为erlang代码,这个过程是怎样的?本文通过一个小测试做下探索. 编译一旦完成,你就看到了真相 Elixir代码组织方式一方面和Erlang一样才用非常 ...
[Erlang 0119] Erlang OTP 源码阅读指引
上周Erlang讨论群里面提到lists的++实现,争论大多基于猜测,其实打开代码看一下就都明了.贴出代码截图后有同学问这代码是哪里找的? "代码去哪里找?",关于Erla ...

随机推荐

ASP.NET Identity入门系列教程（一）初识Identity
摘要通过本文你将了解ASP.NET身份验证机制,表单认证的基本流程,ASP.NET Membership的一些弊端以及ASP.NET Identity的主要优势. 目录身份验证(Authentic ...
Module Zero学习目录
Module-Zero是实现了ASP.NET Boilerplate框架抽象概念的模块,对于企业web应用也添加了一些有用的东西: 实现了ASP.NET Identity框架的用户和角色管理. 提供了 ...
网站使用https协议
了解https HTTPS 是以安全为目标的 HTTP 通道,即 HTTP 下加入 SSL 加密层.HTTPS 不同于 HTTP 的端口,HTTP默认端口为80,HTTPS默认端口为443. SSL ...
作为Coder的利器记载
工作近三年,使用PC快六年,拥抱Mac整一年,投具器石榴裙三年.14年第一次被同事推荐Everything,开启了JeffJade对工具的折腾之旅,并乐此不疲.时去两年,这必然是消耗了一些时间,但对效 ...
Android colors资源文件常用的颜色
<?xml version="1.0" encoding="utf-8"?> <resources> <color name=&q ...
开发node桌面级应用工具：apk转化epub
随着苹果ibooks对国内的开放,最近接了个麻烦的需求: 把现有的APK转化支持苹果ibooks电子书的epub格式 apk,基本都知道就是安卓的应用程序 epub,是ibooks支持的电子书格式 ( ...
Python模拟登陆新浪微博
上篇介绍了新浪微博的登陆过程,这节使用Python编写一个模拟登陆的程序.讲解与程序如下: 1.主函数(WeiboMain.py): import urllib2 import cookielib i ...
React中使用Ant Table组件
一.Ant Design of React http://ant.design/docs/react/introduce 二.建立webpack工程 webpack+react demo下载项目的启 ...
ASP.NET MVC5+EF6+EasyUI 后台管理系统（33）-MVC 表单验证
系列目录注:本节阅读需要有MVC 自定义验证的基础,否则比较吃力一直以来表单的验证都是不可或缺的,微软的东西还是做得比较人性化的,从webform到MVC,都做到了双向验证单单的用js实现的前端 ...
由浅入深学习ajax跨域(JSONP)问题
什么是跨域?说直白点就是获取别人网站上的内容.但这么说貌似又有点混淆,因为通常我们用ajax+php就可以获取别人网站的内容,来看下面这个例子. 来看看跨域的例子,jquery+ajax是不能跨域请求 ...

[Erlang 0128] Term sharing in Erlang/OTP 下篇

[Erlang 0128] Term sharing in Erlang/OTP 下篇的更多相关文章

随机推荐

热门专题