《IBM神经形态计算机》提到我的导师 Carver A. Mead

一篇四个月前的文章:2016年8月5日, 谢一位徐州投资人推荐的一篇文章《IBM 神经形态计算机》暨 北京经济技术开发区管委会代表团询:“与哪位美国半导体行业大咖交往”

文章中提到的“加州理工大学”应是加州理工学院(Caltech),因是关于Caver A. Mead的Neuromorphic。这是在我1985-1959学习和工作的母校、我的导师、我在校所参加的课题和著作《模拟超大规模集成电路和脑神经系统》(Analog VLSI and Neural Systems,1986年出版)。Mead早在1984年曾带着一个建议来访中国,他所建议的项目是:加州理工和科学院-电子部合作组建超大规模集成电路的设计中心。那时的集成电路工业:世界唯一的集成电路标准电路数据库是NSA(国家安全局)出资开发的CMOS3(3微米工艺)和加州理工学院自用的计算机辅助工具(在惠普UNIX和苹果操作系统上运行);世界三大垄断集成电路设计工具供应商(Cadence, Mentor,Synapsis)还都没有诞生,米徳教授和他的团队是集成电路设计工具的发明创造人;喷气动力研究室和加州理工学院率先设计和实现了“多维并行处理器体系结构”。加州理工和麻省理工两所院校每年用掉80%的美国唯一、DARPA(国防先进研究项目局)出资的科研芯片代加工;张忠谋正在台湾筹建世界第一家半导体代加工(硅铸造)的合同制造业模式,取名“台积电”(该公司被预计为2017年世界第三半导体公司,仅次于美国英特尔和韩国三星)。

但Carver A Mead的1977年的经典著作《介绍超大规模集成电路系统》(Introduction to VLSI Systems) 已在美国大学里讲授了八年,米徳-康维定律(“比例版图设计规则能保障同一设计最少修正的密度倍增”)在集成电路行业中成了支撑摩尔定律的工程实践指导。或所以Carver A. Mead是唯一荣获Gordon & Bettie Moore 头衔的计算机科学教授(“摩尔教授”)。

同时,文中所提到的事件驱动体系结构中的逻辑电路,也可追溯到同时源于加州理工学院的相邻发明领域:Asynchronous VLSI and event-driven logic。1989年就发明了第一个事件驱动但与通用体系结构兼容的MiniMIPS微处理器。后来发明人Alan Martin教授和他的学生Mika Nystrom博士在2005年来中国,主持技术引进,完成了我在中关村的民营国际公司和清华微电子所合作的事件驱动微控制器研究项目。Nystrom现任英特尔的处理器芯片设计负责人,并在我的前沿科技咨询公司人项目科学家。

 

关于事件驱动的神经形态计算机概念,主要源于1980-90年代的研究成果。但它并不是加州理工学院的一个孤立超前研究。Mead在70年代开创的超大规模集成电路设计方法学,和他的同事在80年代开始的并行处理体系结构等都是当今通用数字计算机技术的基础。“神经形态计算系统”的提出,是当时针对下一代计算机的基础理论和实践。如果说他们70年代的研究成果奠基了当代的计算机技术,在80年代中开始的神经形态计算奠基或能推动下一代计算机的发展。这样多年积累和多维空间上的延续成就,是一个合适机缘的成功汇合(collective efforts can converge at an appropriated point in the future),才推动了下一代计算机技术的革命。

历年来,中国行业所缺乏的是类似的可持续科学探索和积累,这才是任何差距的真实所在。这些早期项目主要靠的是美国民营工业界(如惠普、英特尔和IBM)和国家项目(如DARPA)长期不懈的科研资助和应用拉动。这种前瞻性的科研支撑,成为延续至今的传统,虽然政府科研经费紧缩,但仍可以看到新一代美国民营企业支撑宇航、新能源交通、现代化物流和大数据等前沿科技项目的宏伟程度。相比当今中国的成功民企和政府大基金,所支撑的科研发展阶段、其内容和体量,仍是很不相同。

文中介绍的相变存储材料是IBM多年研究的基础材料。和其他非易失存储器件技术的探索类似,它们并不可能在早期就清晰地显示其与产业化和市场化的衔接。虽然在材料制备技术中所追求的是同一个合金特征,在2016年发表的IBM苏黎世成果影响着两个计算机应用时代:(1)以每个单元3比特的优势高密度,超过了“当今”英特尔-美光和三星分别研发的两种相变存储器的性价比。(2)以其优异的功能和性能准备了“未来”事件驱动计算机的电路机理。

与IBM苏黎世实验室平行的相变存储研究,几年前在美国纽约州约克城研究中心,曾由耶鲁大学身兼三院士的美籍华人学者携IMB全套300多个专利前来合作在北京、之后去了宁波,其目标是在在中国革新现有非易失存储,贡献以中国为科研和产业重心的大产业格局变迁。同时863专项也支持了相关的专项院校研究。这是IBM共享当前的计算机应用时代的一个努力。

欲实现一个相变存储器的中国产业革新,在国内所论证的投资风险命题,或集中于“这种技术能否主导下一代非易失存储器的主流产业”?这是个虚构的“复合问句”。不管回答是“能”是“否”,都否定了动手发明和实践的可能性。须知这在之前是没法充足论证的,只能预测。所以我们况且应该注意到,这个项目是在探索一个有潜力的“平台技术”。难道所有新技术的早期不都是如此吗?

合格的相变存储技术或能汇合进入的即是下一代的计算机?或许IBM卖掉其在Fishkill的美国最后一个晶园厂时所宣称的“转型生物计算机研究”即包涵了这些?或许三星搬迁Flash存储器产能到西安,而在当时已经测试成功了大容量相变存储器产品原型,即是对非易失存储器的方向已另有打算?那么这个和IBM合作的相变存储器的中国资本,就为中国科学界开辟了一个国际合作的前沿领域。这些都是科学探索,美、韩、中各方都有风险。它的风险和价值考量或并不是一个简单的产品投机?反证:相变存储器的IBM研发团队曾乐观地提出,与中国资本的合作有可能做成下一代计算机存储的新源头。这个中国可能以前没有出现过,以中国现今的经济技术实力,或可“娱乐”一下这个抱负或梦想?

事件驱动的神经形态计算机,或用在彻底改观当今计算机体系结构——在这两个方向上,英特尔、美光、IBM、三星等前沿半导体企业都在各自探索着、甚至在角逐着、同时又是互动着,在创作这个变迁的可能,中国这边也有建议的合作,这里也见得到相关的科学动向。集中前沿相变存储技术,数年来发表了很多相关科学文献。如果日后在国际上真有了大进展而没有中国行业的参与或贡献,我们姑且不比抱怨风险投资者们没有胆识,或行业科技成员没有信心和能力,这的确是在未来可能“汇合”的基础内容,但前期看上去也确实看起来相对孤立、昏昭不分、像是个赌博。理想的、也是理智的抉择在于:战略投资可持续发展的科学技术,必须能辨识有前景的平台项目,还得肯坚持投入和支持。一旦新产品进入成熟期,也就怪不得必然随之而来的技术壁垒和封锁了。因为在初期的学术和科研等暂且“浑然不知”的阶段,在世界的这一边就早有过国际交流、甚至合作的机会;尤其近年来还增添了国际新技术对中国科技金融的高期望,这是技术后进、投资充裕地域的唯一机会窗口。举个实例说明:

1984年,我在北京第一次和米徳教授交谈。那两、三年他频繁往返中美,在硅谷和洛杉矶与中国领导和代表团交流,却未能洽成一个集成电路设计早期合作的交易。其中一个决定不下的问题是:250万美元预算中有100万的加州理工团队的前期成本?罗沛霖院士解释说:那个叫做“知识产权”价值。但中方终不能理解和接受。于今看来,竟是个啥风险评估?

米徳博士当年所直接对话的中国外交官、科学院和电子部领导、国务院超大规模集成电路领导小组领导,在其后十年内成了一代国家领袖;谁能断言近几年决定相变存储器落户北京和宁波的领导,就不能进入中国下一代年轻有为的领导核心?

1984年是中国集成电路大国梦的开端,如果当时和加州理工学院合作了… 

2016年谁能判断相变存储或会有朝一日发展成熟,取代和整合现在的闪存和高价动态存储器?一念之差或能铸造成中国在下一代计算机制造业和应用中的定位。虽然大道理大家都清楚,但还是得正视:早在技术发展的初期就应该涉足科研,而不是仅仅观望。过迟地仿效并不能促成后来的超越。而且对于新兴事业,应该承认个人的影响和推动力。

所以,当北京经济技术开发区管委会代表团询问与哪位美国半导体行业“大咖”交往时,我推荐了摩尔教授米徳博士这样的集成电路“大腕”。这是因为他的杰出教育家风范和重大工业发明,因为他亲手创立了22家成功硅谷创业公司,因为他和诺贝尔奖金得主理查德.费曼教授的互相赞赏及其关于物理学理论互为诤友的创建(或按国内说法堪称“诺级水平发现”的创新理论),因为他瑞典皇家科学院授予的院士称号,因为他以设计自动化、方法学和教学名列前驱进入华盛顿计算机历史博物馆,因为他所获得的国家科技勋章及所有成就奖和发明奖,因为他促成中国集成电路早在80年代成功起步的能力和热心,因为他和英特尔创始人佛多黎哥.法基的创业公司发明了代替计算机”鼠标”的“触摸板”,因为他所创建的硅视网膜、人体神经仿真的硅视觉和听觉系统,因为他独创的世界最高密度立体结构硅成像器,因为他浮栅非易失存储原理的发明以及射频电子标签的工业化,以及最近加州理工学院继“摩尔教授”基金之后征集“米徳教授”基金、赞助后摩尔时代微电子学术精英的意图,等等。这些都是中国学界和工业界所追求和憧憬的世界科学成就和产品名誉。

中国的事情,尤其是说“远”也“近”。

… 或者还是跟我一起攻关“个人超级计算机(PSC)”? 中国是消费市场和制造业大国,PSC虽然不如相变存储决策那样显得高大上,但也确是个“中国迎头赶上”的实际亟需工业内容!

 

加州理工学院计算机科学系主任阿兰.马汀,背景是世界上第一个事件驱动微处理器的版图。

 

附:那一位徐州投资人推荐的文章。

2016-08-05 新智元   IBM首个人造神经元幕后,神经形态计算系统向人造大脑突破

来源:IBM Research、The Economist 等    译者:闻菲、张冬君

【新智元导读】日前,IBM苏黎世研究院研究人员利用相变存储材料,制造出首例随机兴奋人工神经元。《经济学人》评论,这是在人造大脑方面的又一突破。模仿大脑的概念简单,但实际把它做出来却相当难。有了IBM 的这项突破,今后再将随机相变神经元集群与其他纳米计算材料结合在一起,能够成为下一代超密神经形态计算系统的关键。

没有人知道人脑是如何工作的,因此研究人脑的研究员才想出了“模拟”的方法。常见的方法是用神经形态元件制作出一个人造大脑。计算机科学家早就从生物学中汲取灵感,最近被称为“深度学习”的人工智能技术,就是模仿人脑的生理行为。

相变存储材料动态演示图

神经形态(Neuromorphic)一词最早是在 20 世纪 80 年代,由加州理工大学的计算机科学家 Carver Mead 提出。神经形态工程学(Neuromorphic engineering)希望利用具有模拟电路特征的超大规模集成电路(VLSI),模仿人脑神经系统,最终目标是制造一个仿真人脑的芯片或集成电路。神经形态工程学需要跨领域的合作,也吸引了生物学、物理学、数学及信息科学等各方面人才的投入。

日前,IBM 苏黎世研究院的研究人员利用相变存储材料获得了突破。IBM 研究员 Evangelos Eleftheriou 表示,过去十年来,IBM 一直从事相变存储材料的研究。“现在,我们又展示了这些使用相变材料制作的人工神经元的能力,它们能够以非常低的能耗进行高效无监督学习和数据相关的检测等多种简单的计算。” Eleftheriou 说。

论文的第一作者 Tomas Tuma 表示,随机相变神经元集群与其他纳米计算材料结合在一起,能够成为下一代超密神经形态计算系统的关键。相关论文日前被《自然·纳米技术》作为封面论文发表。

世界首例随机兴奋人工神经元

科学家几十年前便提出,能够制作出具有类似人脑功能的神经形态集成电路。但一直以来,能耗的问题都没有得到解决。

现在,IBM 苏黎世研究院的研究人员利用相变存储材料获得了突破。IBM 研究员 Evangelos Eleftheriou 表示,过去十年来,IBM 一直从事相变存储材料的研究。“我们展示了这些使用相变材料制作的人工神经元的能力,它们能够以非常低的能耗进行高效无监督学习和数据相关的检测等多种简单的计算。” Eleftheriou 说。

论文的第一作者 Tomas Tuma 表示,随机相变神经元集群与其他纳米计算材料结合在一起,能够成为下一代超密神经形态计算系统的关键。

IBM 苏黎世研究院研究人员制造的这款人工神经元,由相变合金锗锑碲(GeSbTe)组成,GeSbTe 也是制作蓝光光碟的一种基础材料,在不同的条件下会处于无定形和晶体两种不同的状态。

相变存储器由于具有读写速度快、能耗低、非挥发性、数据保持时间长以及与硅加工工艺兼容等特点,被认为是最有可能取代目前的 SRAM、DRAM、FLASH等产品成为未来主流的存储器产品。GeSbTe硫系三元化合物已经被成功应用于光盘系列相变存储器,也是在PCRAM
应用中最具竞争力的相变材料。

生物神经细胞在传导神经兴奋信号时,会经过神经递质,也即一层液态的神经薄膜,这层神经薄膜在接收到信号时,不会立即释放,而是当能量积蓄到一定程度后,才会向外发射信号。这个信号沿轴突传导,被其他神经元接收。

 

艺术家创作:相变合金液锗锑碲(GeSbTe)覆盖的人造神经元。来源:IBM 研究院  >

IBM 研究人员用一小滴锗锑碲合金液作为神经薄膜的替代品。实验中,研究人员将人工神经元接通后,输入一系列电脉冲信号,从而使材料发生一系列相变,最终使人工神经元发射信号。

具体看,一小滴锗锑碲合金液两边分别接通电极。随着电流的通过,合金液的导电性会发生改变。最开始,这一滴锗锑碲合金液不含有任何晶体结构,因此导电性很差。但当低压电流通过时,一部分合金温度升高并开始形成结晶,导电性也随之增强。继续通电,整滴合金液的导电性都会增强,直到最后电流完全能够通过,就好像生物神经薄膜能量积蓄满之后发射神经脉冲信号一样。之后,再加上高压电流,让整个合金液熔化,就能回到初始状态。

在神经科学中,这种现象被称为神经元的 integrate-and-fire(IF)性质,也是基于事件计算的基础。

生物神经元是不可预测的,细胞里的震动表明特定的输入不一定会得到同样的输出。自然正是利用这种随机性,让神经元完成了不可思议的工作,比如从复杂的数学题目中得出局部最小准则(local minimum criterion,LMC),这是依靠算法的数字计算机无法做到的。由于每次结晶的具体细节都不同,因此可以认为,这些人工神经元的动作是相对比较随机的。

IBM 研究员 Evangelos Eleftheriou 表示,由于有了 IF属性,单一的人造神经元也能被用于处理实时信息流,并从中找出规律、发现关联。例如,在物联网中,传感器能采集并分析网络边缘收集到的数据,预测天气。此外,人工神经元也能被用于检测金融数据的规律,或者分析社交网络数据,实时发现文化潮流。

神经形态计算:模拟人脑神经元行为

神经形态(Neuromorphic)一词最早是在 20 世纪 80 年代,由加州理工大学的计算机科学家 Carver Mead 提出。神经形态工程学(Neuromorphic engineering)希望利用具有模拟电路特征的超大规模集成电路(VLSI),模仿人脑神经系统,最终目标是制造一个仿真人脑的芯片或集成电路。神经形态工程学需要跨领域的合作,也吸引了生物学、物理学、数学及信息科学等各方面人才的投入。

Carver Mead 在上世纪 70 年代为摩尔定律命名,他开创了半导体行业的许多个第一,其中包括设计复杂硅芯片(超大规模集成电路)的方法,直到今天,这种方法仍然具有影响力。

<  1971年,Mead在加州理工教授 VLSI 技术的第一堂课。来源:caltech.edu

上世纪 80 年代,对标准计算机的局限性感到沮丧的 Mead 开始制造模拟哺乳动物大脑的芯片,也由此创立了名为神经形态计算的领域。Mead 使用亚阈值(sub-threshold)硅模仿大脑的低功耗处理过程。在十分微小的电压下,正常芯片无法将比特从“0”改变为“1”,但亚阈值硅仍然有微小的、不规则的电子流通过,这种自发电流的涨落,其大小和可变性,与神经回路中流动的离子所形成电子流非常相似。

20 世纪 90 年代,Mead 和同事发现,构建硅神经元网络是有可能实现的。该装置通过结点(junction)接收外部电流输入信号,结点的作用类似于真实神经系统中的突触——神经脉冲通过突触,从一个神经元传到另一个神经元。和真正的神经元相似,硅神经元允许传入的信号在电路的内部积蓄电压。当电压达到一个特定的阈值,硅神经元就会“放电”,产生一系列“电压尖脉冲”(voltage spike,即瞬间出现的电压峰值),这些“电压尖脉冲”会沿着一条导线传播,这条导线的作用类似神经元的轴突。尽管这些尖脉冲是“数字化”的,只能处于开或关这两种状态,但硅神经元却像真正的神经元一样,是以非数字化的形式运行的,因此硅神经元的电流和电压并不限于几个不连续的数值,这与传统芯片完全不同。

硅神经元的表现,反映了大脑节能的一个关键因素:与真正的大脑一样,硅神经元在“放电”之前,只是简单地整合输入信号,这只需要很少的能量。而在传统计算机中,无论芯片是否进行运算,都需要持续输入能量,维持内部时钟运行。

IBM苏黎世研究院的研究人员利用相变存储材料,制作的随机兴奋神经元。两边微小的方形是电极的导电板,很尖的探针触碰到导电板,让相变材料回应神经信号输入。每组探针都能接触到100个细胞组成的一个集群。来源:IBM研究院

无论现今的智能型产品多么智能、电路多么复杂,但与人脑相比都还只是玩具,尤其是功率。人脑包含上千种神经细胞及神经元组成的一个极为复杂的网络。光是”模拟”一个神经元的行为,就需要消耗大量计算资源。

神经形态工程学所追求的未来芯片,就是将大量的逻辑电路整合进一个芯片中,透过个芯片的控制,让各种高科技产品能够顺利运作。

现在,IBM 研究人员已经将好几百个这样的人造神经元构成集群,并用这些集群代表快速复杂的信号。不仅如此,每个人造神经元都表现出了很高的耐受性,能够在 100 Hz 的频率下运行好几年。每个神经元的能耗都少于 5 皮焦,平均能耗少于 120 微瓦。相比之下,60瓦的电灯泡需要消耗 6000万微瓦。

研究人员专访

参与这项研究的IBM苏黎世研究员(从左到右):Abu Sebastian,Evangelos Eleftheriou,Tomas Tuma,Angeliki Pantai 和 Manuel Le Gallo。来源:IBM研究院

IBM 苏黎世的暑期实习生 Millian Gehrer 采访了参与上述研究的研究员 Manuel Le Gallo。

人工神经元的功能是什么?

Manuel Le Gallo:神经元具有一定的功能,我们称之为“整合和触发(integrate and fire)”。神经元就像一个蓄电池,如果你不停地向神经元输入电流,它就会整合所有的输入电流。膜电位取决于输入电流的量和强度,它在达到一定的阈值时,会“fire”或者“spike。这种蓄电池可用于执行极其复杂的计算任务。

人工神经元的发展带来怎样的灵感?

ML:人工神经元旨在模仿生物神经元的活动。人工神经元的功能不可能和生物神经元完全相同,但是非常相近,足够用来执行人脑里的计算。人工神经元通常是用基于CMOS的电路制造的,这是我们在计算机中使用的标准晶体管技术。我们的研究使用的是非CMOS装置,比如相变装置,以再现降低能耗和增加磁录密度的相同功能。

你对论文的贡献是什么?

ML:过去三年我一直从事相变存储材料的相关工作。这项研究加深了我们对相变存储材料特性和模拟的了解,这对于使用相变材料制作存储器是至关重要的。此外,我们还获得了实验数据,对结论的分析和阐释也有所贡献。

人造神经元在什么情景下使用?

ML:论文中,我们展示了如何从多次事件输入流中检测到关联性。假设有很多二元事件流,想要找出哪两条暂时相关,比如在1秒钟内同时发生。我们展示了如何从多个事件流当中检测关联性。

 “事件”是什么意思?

ML:事件可以指Twitter的数据,或者物联网收集到的天气数据或者传感器数据。假设你现在有多条二元事件流,你想找出其中哪些是暂时相关的。论文中我们展示了,只用一个神经元就可以做出这样的区分,这个神经元与多个接收这些事件的突触相连。

神经形态计算比传统计算更加高效的原因是什么?

ML:传统计算,存储单元和逻辑单元是分开的。每次计算时,你需要先访问存储器,得到数据,再将其转移到逻辑单元,逻辑单元计算得出结果后,再将这一结果发送给存储单元,如此往返。因此,如果要处理的数据有很多,那么就会很麻烦。

在神经网络中,计算和存储是一体的。不需要在存储单元和逻辑单元之间建立联系;只需要在不同的神经元之间建立起合适的连接即可。这也是我们的研究能效更高的原因,尤其是处理大规模数据时。

资料:

1 You’ve got a nerve,http://www.economist.com/news/science-and-technology/

2 IBM Scientists Imitate the Functionality of Neurons with a Phase-Change Device

3 Stochastic phase-change neurons, Tomas Tuma, Angeliki Pantazi, Manuel Le Gallo, Abu Sebastian and Evangelos Eleftheriou, Nature Nanotechnology, doi:10.1038/nnano.2016.70

4 仇烨译,《麻省科技评论 | 卡弗·米德谈计算机未来》,iWeekly

5 westwell lab,神经形态工程学的前世今生 http://toutiao.com/i6285495256003641857/

6 Unsupervised learning with artificial neurons(https://www.ibm.com/blogs/research/2016/08/unsupervised-learning-artificial-neurons/)