`
badxy
  • 浏览: 138169 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

zz Java并行(1):JMM

阅读更多
zz Java并行(1):JMM

1.什么是JMM?

    JMM即Java Memory Model,设想有这样一条赋值语句:int a = 1;而a为诸多线程所共享, JMM所关注的问题就是:“读取a的线程在何时会看到值为1的这个写入?”

2. 为什么关注JMM?

    在多数情况下,即使是并发程序的程序员,也并不特别关心JMM,因为Java语言与JVM用更高抽象的“同步”语义隐藏了JMM的语义,使得程序员即便对JMM一无所知,也可以写出优雅的并发程序。许多介绍Java同步机制的资料也并不对JMM做过多的介绍。那么你可能会问,“那一上来就讨论JMM有毛用啊?”相信我,是有毛用的。虽然我对Java并不是十分精通,Java下的并发编程更是新上手的菜鸟,但近一段时间的学习经验告诉我,所谓同步,无非关注于两点,一是互斥性,二是可见性。结合自己过去的认识,对并发的理解过多侧重于“互斥性”,而对“可见性”一知半解,影响了对同步更精细的理解。JMM则对此有十分清晰的阐述。

3.JMM从何而来?

    这就要从盘古开天辟地开始说起了……话说冯诺依曼童鞋当年提出经典的体系结构时,打死他想不到现代的计算机体系结构会发展到这个鸟样子。冯诺依曼模型是一个顺序化的计算模型,可见性不是什么问题,而今天的多处理器架构已经很少再使用顺序一致化模型,而且处理器和编译器的一些优化都会对内存的可见性产生影响:

a. 处理器乱序执行

b. 存储在处理器本地的缓存,对其他处理器不可见

c. 作为优化,编译器可能把变量存在寄存器而非内存

d. 聪明的编译器可能改变生成指令的顺序

    更棘手的是,江湖之大,各门各派对这些行为并没有达成统一的共识,不同架构的处理器提供了不同级别的cache coherence,而所谓一种架构的Memroy Model,即是说在该架构中,Memory的行为对应用程序做出怎样的担保。而不同架构中memory barrier这样特殊的指令,正是为了获得memory协调性而引入的。而JMM则隐藏了这些不同架构MM的差异性,千秋万载一统江湖斯密达。

4. Happens-before关系

    在介绍JMM之前,我们先来了解一些比较重要的概念:

a. 如果我们把程序看成一个“动作”的集合U,在一个程序的一次执行中,所有这些动作都会在时间上(注意是时间上)有一个次序关系,我们记做“tb”(time-before)关系,显然tb是一个“全序关系”(反对称,传递,并且任意两个动作可比)

b. 在这个“动作”集合中,有一些动作被称作“同步动作”,包括上锁/解锁,读写volitile变量,线程开始/结束等。在这个同步动作子集S上,有一个全序“sw”(synchronize-with)关系。详细的SW定义:

    对同一个锁,有上锁动作A,解锁动作B,如果B tb A, 则B sw A
    对同一个volatile变量,有写动作A,读动作B,如果B tb A,则B sw A
    对于一个线程,start动作记做A,B为任一该线程中的动作,则A sw B
    对于一个线程,检测到线程终结的动作记做A(包括join返回,isAlive返回false等),B为任一该线程中的动作,则B sw A
    线程t1调用线程t2的interrupt动作记做A,t2检测到中断(抛出InterruptedException,或者检测到interrupt状态更改)记做B,则 A sw B
    对一个变量默认值赋值(0,false,null)动作记做A,对它的任意操作记做B,则A sw B
    一个对象的构造函数结束动作记做A,该对象的finalizer开始记做B,则A sw B

SW一致性含义:在全序SW中,任一个读操作读到的值是在它之前最后一个写操作写入的值。



c. 在动作集合U上,有一个偏序(自反,反对称,传递,但不是任意两个元素可比)“hb”(happens-before)关系,而他和sw关系有着千丝万缕的关系:那就是如果把sw关系从S集合拿到他的超集U中,求传递闭包,再加上“intra thread原则”——单一线程中,如果动作B在程序中出现在动作A之后,那么A hb B(这很好理解,相当于顺序模型运用在了每个线程内部)。

即有:  HB = t(SW) + IntraThread.

    OK,现在我们已经对HB关系做出了定义。之所以要把它用离散数学的语言写出来,不单单是为了装逼,而是我深感在一些概念性的解释中,数学语言的描述是最简洁、歧义最小、最易于理解的。

HB一致性的含义:对于一个变量,有读操作R,写操作W,如果不存在R hb W,并且也不存在另一个写操作W’,使得W hb W‘,并且W’ hb R,那么,W所写的值对于R来说,是“可能”看见的。(这好像法律条文——凡是没有禁止的,都是可能做的)



注意1:这里需要提出的一点是,HB关系和TB关系是没有必然联系的,也就是,如果A hb B, A不一定tb B, 反过来也一样, 如果A tb B, 不一定就有 A hb B, 这是通常容易混淆的。

注意2:从我们的定义中就可以发现,tb、sw的某些规则(前两条)、hb的某些规则(从sw演化而来的)都是依赖于某次特定的执行(execution)的,在这些情景下,脱离了这个前提,单纯的提A hb B还是C sw D都是没有意义的。



5. JMM现身

    做了这么多铺垫,主角到现在还没有出现,作为导演鸭梨很大。前面已经介绍了HB关系模型,您可能认为这就是JMM了,其实是有微小差别的——JMM是一种更严格的HB模型。严格在哪里呢?JSR133中有一大段形式化描述,看得犯晕,即使我个人再喜欢装逼也万难再描述一遍,我用我的理解来做出简单的解释,请大牛们检查。我们看一个例子:

初始条件:x = y = 0
div css xhtml xml Example Source Code Example Source Code [http://www.cnblogs.com/tomsheep/]

Thread 1:
a = x; //A
if(a == 1)  //B
  y = 1;  //C

Thread 2:
b = y;  //D
if(b == 1)  //E
  x = 1; //F

看上去有点paradox的意思,你可能认为最终a = 0, b = 0是唯一的结果。但是,在HB模型中,不是这样的。让我们来看上面这个例子:我们没有对两个线程做任何同步,对于a,b,x,y的读写都是可能存在data race的。

插播一条data race的定义:对同一变量的两个操作A、B,如果至少有一个写操作,并且A、B不存在HB关系,则我们说两操作存在data race。

    这里,我们把六个操作分别编号(其实6个操作可以再细分为很多个小操作,但这里不需要),我们从HB的定义中可知,同一线程中,A hb B,B hb C,D hb E, E hb F,但是,这个例子中,F和A并没有HB关系,根据HB一致性原则,那么A可以读到F的写入;同理,D可以读到C的写入——这是违背直觉的,但我们并没有违反HB的法律。所以在HB模型中,这是被允许的。

    在JMM中,上述情景是被禁止的。而JMM是通过什么新的条文做到这一点的?我的理解是,只用了下面一条规则:

JMM附加规则:如果某一动作的发生与否不取决于任何data race的发生与否,那么,这个动作是可以被early committed的。

    带着这条规则,我们再来看上述例子,显然,这样一来,F不能在A之前commit,因为他依赖于对y读写data race的发生,y又依赖x,绕回来了,总之,如果不发生竞争写入,则F不可能发生。如此一来,上述情景被禁止了。为了更好理解,我们再来看一个例子:

初始条件:x = y = 0

div css xhtml xml Example Source Code Example Source Code [http://www.cnblogs.com/tomsheep/]

Thread 1:
a = x; //A
y = 1;  //B

Thread 2:
b = y;  //C
x = 1; //D

看上去跟刚才那个例子差不多,但如果我告诉你在这个例子中,a = 1, b =1 就是可以被JMM接受的,你会不会感到惊讶?让我们再来检查我们的规则:同样,D和A没有HB关系,B和C没有HB关系,而且,对于附加规则,B、D动作的发生不依赖与任何data race, 即是说,有没有data race,我都可以发生,那么,所有限制性规则再次全军覆没,a = 1, b = 1 可以接受。

最后一个例子:

初始条件:x = y = 0
div css xhtml xml Example Source Code Example Source Code [http://www.cnblogs.com/tomsheep/]

Thread 1:
a = x;  //A
b = a | 1;  //B
y = b;  //C

Thread 2: 
c = y;  //D
x = c;  //E

这个例子就没有刚才那么直观了,现在的问题是a = b = c = 1是JMM可以接受的结果吗?直觉上说,你可能脱口而出,不可能,因为违反了附加规则:操作B依赖于x的data race,x依赖y……B不能提前commit。你很聪明,但是,遗憾的是,编译器比你还聪明。我们看,在B执行的时候,a的取值可能有哪些?没错,无非是0或者1,那么,作为一个比你还聪明的编译器,看出“B操作的本质无非是b = 1,这个操作不依赖于data race发生与否”这一事实,应该是情理之中吧。那么它就会做出优化,把上述代码变为:
div css xhtml xml Example Source Code Example Source Code [http://www.cnblogs.com/tomsheep/]

Thread 1:
a = x;  //A
b = 1;  //B
y = 1;  //C

Thread 2: 
c = y;  //D
x = c;  //E

现在,你还说他违反附加原则吗?因此这个情景是被JMM接受的。



上述是我对JMM一点皮毛的理解,主要参考资料:

1. JSR133

2. Addison Wesley, Java Concurrency in Practice ,Brian Goetz

3. 各路网文
分享到:
评论

相关推荐

    JAVA知识图谱:JVM、JMM、JUC、NIO、Netty、IOC、AOP、Jav-JavaKnowledge.zip

    JAVA知识图谱:JVM、JMM、JUC、NIO、Netty、IOC、AOP、Jav-JavaKnowledge

    Java内存模型详解JMM.docx

    Java内存模型详解JMM.docx

    深入Java内存模型-JMM

    深入Java内存模型-JMM。。。。。。。。。。。。。。。。。。

    java内存模型jmm

    java内存模型jmm

    实战Java高并发程序设计(第2版)PPT模板.pptx

    1走入并行世界 1.1何去何从的并行计算 1.2你必须知道的几个概念 1.3并发级别 1.4有关并行的两个重要定律 1.5回到java:jmm 1.2你必须知道的几个概念 1.3并发级别 1.4有关并行的两个重要定律 1.5回到Java:JMM 实战...

    互联网程序员都每天刷题嘛-jmm:jmm

    这些数据都意味着,作为一名java程序员,必须要掌握多线程开发,谈及多线程,绕不开的是对JMM(Java 内存模型)。那么什么是JMM?什么是可见性、原子性、有序性?本文将从CPU的缓存开始谈起,深度解剖JMM底层原理。 CPU...

    手机java模拟器JMM3.0

    为智能手机安装java支持,使手机可以安装使用java应用程序如游戏等

    Java高并发实战_java高并发_高并发_

    介绍了两个重要的并行性能评估定律, 以及 Java 内存模型 JMM。第2章介绍了 Java 并行程序开发的基础, 包括 Java 中 Thread 的基本使用方法等第3章介绍了 JDK 内部对并行程序开发的支持, 主要介绍 JUC (Java.util....

    java内存模型JMM(Java Memory Model)1

    由于JVM运行程序的实体是线程,而每个线程创建时JVM都会为其创建一个工作内存(有些地方称为栈空间),工作内存是每个线程的私有数据区域,而Java内存模型中规定

    java内存模型(JMM).docx

    大家都知道,计算机在执行程序时,每条指令都是在 CPU 中执行的,而执行指令过程中,势必涉及到数据的读取和写入。 由于程序运行过程中的临时数据是存放在主存(物理内存)当中的,这时就存在一个问题:由于 CPU ...

    【java模拟器】最新最完美的JAVA模拟器JMM_SmartPhone_2003_SmartPhone_5.0_SmartPhone_6.0

    【java模拟器】最新最完美的JAVA模拟器JMM_SmartPhone_2003_SmartPhone_5.0_SmartPhone_6.0

    Java重要的基础知识/高级特性/工作经验170页笔记

    JMM: Java Concurrency Java运行的基础之一 2 . Java Concurrency: Java Java最重要的高级特性之一 3 . JVM:即Java Virtual Machine.我们都知道一件事---出来混,迟早都要还的 我对这本笔记的期待是,帮助所有想...

    sgys108jmm1.apk

    sgys108jmm1.apk

    JMM&JSR;.rar

    Java程序是需要运行在Java虚拟机上面的,Java内存模型(Java Memory Model ,JMM)就是一种符合内存模型规范的,屏蔽了各种硬件和操作系统的访问差异的,保证了Java程序在各种平台下对内存的访问都能保证效果一致的...

    Java面试题03-JMM内存模型之可见性

    1.申请服务器 2.部署服务器 3.域名申请和配置 三.小程序发布 1.下载DEMO 2.下载开发工具并安装 3.配置参数 4.发布 完整说明 一.微信小程序申请 申请,并认证(未认证不能发布,认证需要300元,目前只支持企业认证)...

    Java内存模型JMM浅析

    Java Memory Model简称JMM, 是一系列的Java虚拟机平台对开发者提供的多线程环境下的内存可见性、是否可以重排序等问题的无关具体平台的统一的保证。(可能在术语上与Java运行时内存分布有歧义,后者指堆、方法区、...

    Java理论与实践:修复Java内存模型2

    虽然许多Java平台提供了比JMM所要求的更强的保证,但是JMM中的漏洞使得无法容易地编写可以在任何平台上运行的并发Java程序。JSR 133显著增强了volatile的语义,这样就可以可靠地使用volatile标志表明程序状态被另一...

    Java理论与实践:修复Java内存模型1

    本文还介绍了JMM有一些严重的缺点,如果正确地编写并发的类太困难的话,那么许多并发的类不能按预期工作,并且这是平台中的一个缺点。在不破坏在旧的内存模型下正确同步的任何代码的同时,我们可以创建一个与大多数...

    JAVA体系结构:Java培训项目,包括Java的各种核心知识

    第十三阶段学习指南 |-0.设计模式|-1.并发编程|-2.spring源码解读|-3.Mybatis专题|-4.JVM性能调优|-5....Java并发编程实质篇:并发基础+ JMM +线程池+一根量子+并发集合+并发工具类+锁+ atomic JVM与性能调优篇:

    Java内存模型JMM详解

    主要介绍了Java内存模型JMM详解,涉及volatile和监视器锁,final字段,内存屏障等相关内容,具有一定参考价值,需要的朋友可以了解下。

Global site tag (gtag.js) - Google Analytics