第6章 再就业的金光大道(1/2)
一早晨陈洋就在办公室里清洗数据,为深度学习程序的模型训练做准备。
清洗数据可不是用水洗,而是通过纠正和删除数据集中的错误、重复部分,以提高数据质量、去除冗余数据的过程。
主要对王奇裳提供的芯片设计方案进行分类和整备。
陈洋的芯片设计软件毕竟是初代品,对逻辑图和版图分辨能力差,陈洋要把版图数据剥离出去,只留下逻辑图。
芯片逻辑图是通过符号和线条等抽象的图形方式来描述电路的逻辑关系,类似于电路原理图。而版图则是利用实际元器件的大小和位置来展示电路的物理布局。
整个工艺流程陈洋是这样设计的:借助深度学习的方式,训练出会绘制芯片逻辑图的人工智能。
先有逻辑图后有版图,逻辑图抽象于概念,版图屈从于现实,把版图映射到物理描述层面,在芯片生产工厂将设计好的电路映射到晶圆上生产,经过封装测试,造出来实实在在的GPU,再焊接到PCB版子上,安装上mos管,显存,电容电阻,再装上换热结构,最后外壳一套,贴上信仰标,这就是一块显卡。
维尼也在同一间办公室工作着,他正在搭建的就是王奇裳提供的算力服务器。算力服务器就是专注于提供算力服务的高性能计算机,安装的是计算卡,算是显卡的一种,但是没有显示输出,也不会出现买显卡买到计算卡的问题,因为一般计算卡比同性能的消费级显卡贵很多。
王奇裳不仅为NOX小队提供了大量的图形芯片逻辑图和版图,然后还向临近的超威半导体研究所借来了算力服务器,早晨看着服务器运抵以后,这才匆忙飞回圣克拉拉硅谷。
维尼目前在把核心部件VegaFE计算卡一片片安装进服务器,再把服务器与服务器使用专用数据线连接,以实现数据共享和任务协同,他戴着防静电手环,小心精密地进行动作。
王奇裳的面子大得惊人,VegaFE配备了4096个流处理器,有16G的HBM2大显存,峰值单精度性能足足13.1 TFLOPS,17年6月27日发布,是2018年最快的HPC加速卡之一,通过桥接器可以将四块卡绑定在一起,搭配双路霄龙,实现八卡并行。
目前一共有8台服务器,陈洋敲了敲计算器,算力集群一共100TFLOPS。(秒万亿次浮点)
维尼把每一台服务器都连接到位,满头大汗地宣告算力集群搭建成功,陈洋的深度学习软件终于可以开始运转,他甚至有点迫不及待。
随着接电完成,程序进行算力调用,服务器里的双滚珠轴承工业风扇开始狂躁地轰鸣,声浪一浪接着一浪,办公室就像开了二十个电吹风,陈洋和维尼面面相觑。
“要不咱把它们推到隔壁吧,要不咱去隔壁工作——反正人和设备不能放在一起,噪音太大受不了。”维尼向陈洋建议着,陈洋立马从谏如流,放下手里的活站起身来活动两下,就和维尼一起搬服务器。
安顿利索,陈洋把数据陆续导入深度学习软件开始训练,这个过程被坊间称为炼丹,时间有长有短,几小时到几天不等,全看服务器算力大小,还有数据拟合收敛情况。
完成至关重要的一步后,陈洋终于长长地松了一口气,彻底放松下来。
他的全套生成式设计软件胜利在望!
人事已尽,余下的看天命!
陈洋也知道,他的深度学习项目很多问题并未解决,由于提供训练的资料几乎全是超威半导体的设计图,超威半导体对自己的芯片进行了大量专利保护,包括流处理器架构、内存控制、计算单元各方面的技术。
要是将来算出来的芯片都是超威农机的专有技术,因此一定会产生侵权问题,陈洋倒是并不担心。
熟知深度学习原理的他知道,深度学习的本质就是从无序中寻求有序的过程,通过粗暴的成百上千亿次的运算,最终一定会从专利技术中会推导出更为本源的公理。
而公理,没有专利,属于全人类。
谁敢说一加一等于二是专利,当场就被幼儿园小盆友打洗你。
八台服务器嗷嗷叫着算了一周,终于把模型算了个七七八八,当看到训练损失开始稳定,数值也不再下降时。陈洋对照曲线算了算,基本确认模型已经趋于收敛,宣告第一次炼丹大功告成!
恰值深夜,远处已经一片静谧,月亮不知何时悬于夜空中央,好像镶嵌在黑色天幕上的一片美丽宝石,陈洋索性扭开窗户,让夜风吹透他的头发,恣意吹过他的脸颊。他深深呼吸着新鲜的空气,回忆这忙碌而精彩的一周。远处传来几声蟋蟀的啁啾,萤火虫在草丛中闪烁,如同无数星星点缀着大地,让人感到恬适和自在。
就这么磕磕绊绊,加入了一个莫名其妙的组织,又经过传说中的科研大佬指点,这才收获芯片设计算法和模型,陈洋试图通过深呼吸来平复心
本章未完,请点击下一页继续阅读