兄弟二人联合创业,AI编译器开始的AI“芯“历程
指令集架构是处理器的抽象模型,目前主宰微处理器市场的主要指令集架构包括 ARM、MIPS、POWER 和 X86 等,经过多年的发展,上述架构已拥有稳定成熟的软件生态,同时也存在一些问题,比如为了获取兼容性而引入了复杂冗长的指令,以及防止软件生态的碎片化而采取了封闭式指令集维护,这使得客户不可随意扩展其该架构的指令集。在IoT/AIoT大行其道,定制化的硬件软件(DSA/DSL)架构盛行的今天,这种封闭式的指令集架构存在的问题逐渐显露。
本文引用地址:http://www.amcfsurvey.com/article/202006/414409.htm每个时代都有其鲜明的时代特色,处理器指令集架构也不例外, RISC-V 指令集架构就属于时代催生的产物,凭借其免费开放的指令集、便捷的指令集扩展标准等优势,一经问世便深受国内外芯片设计企业、高等院校和芯片设计爱好者的欢迎。
目前有很多开源组织、科研院所、商业公司无偿开源其 RISC-V 处理器IP及相关工具软件,其中有些开源 RISC-V 处理器IP在性能和功耗等方面能够与商用处理器 IP 媲美,甚至超过了部分商用处理器 IP。
作为指令集架构大家族中的新贵,RISC-V 尚属发展的早期阶段,虽然基础指令集的定义已经完善,但有不少指令扩展标准还在开发阶段。更值得一提的是其软件生态的发展,用匮乏来描述毫不夸张,也正是这种匮乏在制约着 RISC-V 的进一步推广以及在实际芯片产品中的应用。但从目前开源 RISC-V 处理器的个数、增加的速度和代码的质量来看, RISC-V 有着不可估量的发展前景,同时它也预示着硬件开源时代的到来。
正是在此背景下,海山和海明两兄弟义无反顾地踏上了创业之路,他们不仅都是资深的开源爱好者,同时也是最佳合作伙伴,其中海山主要研发软件,海明主要研发硬件。能够软、硬件互补是他们最大的优势所在。
图示:译芯科技创始人海山和海明
兄弟二人联手踏上创业之路
早在 2006 年开源微处理器还未被行业所了解和接纳的时候,二人便开始利用业余时间合力打造 5 级流水线的 RISC 处理器 Potato-I 及配套的 GCC 编译器,最终以参赛的形式将处理器代码提交到 Xilinx 的 OpenHW 网站,并在第一届 Xilinx 开源硬件大赛上取得优异成绩。
处理器架构的优美和编译器内部的神奇始终吸引着两位创始人,不仅工作和学习在围绕着这两个方向发展,处理器和编译器设计也成为了他们的终身爱好。早在 2015 年 RISC-V 指令集开放后,二人便着手设计实现了一款 RISC-V 处理器核,并且萌生了共同创业进军微处理器市场的想法,但限于当时国内行业对 RISC-V 的甚少了解和对微处理器设计的不重视,最终未能得到投资人认可的二人只能选择放弃。
放弃了第一次创业后,兄弟俩重新选择步入职场,其中海明加入到国内 AI 初创企业云知声,海山则继续在知名外企从事软件研发工作。能够软、硬件互补的他们从未放弃过开源这一爱好,也就是从 2015 年那一刻起海山便开始了 RISC-V LLVM 编译器的业余开发工作,并在几年后完成了 LLVM 编译器的后端研发。
2019 年 5 月,海山拿着当时市面上功能最完整,同时可靠性和稳定性都已达到可商用化指标的RISC-V LLVM编译器创立了北京译芯科技,海明紧随其后,也加入到了译芯科技。至此,兄弟二人再次在译芯科技开始了创业之路。
由于创业之初就有了成熟稳定的 RISC-V LLVM 编译器,译芯科技成立不久便推出了 RISC-V 商用 LLVM 编译器及基于该编译器的RISC-V AI工具软件,并通过该AI工具业界首次实现了TensorFlow XLA demo在RISC-V硬件上的运行。译芯科技RISC-V LLVM编译器和AI编译器不仅为 RISC-V 处理器在人工智能领域的落地提供有力的工具链支撑,同时开启了 RISC-V 处理器走向智能 Android 设备的大门。
下一步将开辟AI市场
对于译芯科技而言,LLVM 编译器的研发成功是公司创立的基石,而下一步便是要正式应对市场的考验,进而踏入 AI 和安卓这两大应用领域。由于公司刚刚成立不久,不具备同时打造两款产品的条件,因此结合人力、物力投入,市场行情等多种因素后,兄弟俩决定首先主攻 AI 市场,从 AI 处理器切入,结合完善的 AI 工具链,打入 AI IP/芯片市场。
实际上,进入 AI 市场是兄弟二人深思熟虑后的决定。“总觉得2015 年过早放弃 RISC-V 处理器创业探索是个莫大的遗憾,可能是因为想弥补这个遗憾,我一直在关注开源处理器的发展,后来发现另外一个即将爆发的芯片市场,是一个全新的芯片类型,也就是今天的 AI 芯片。于是我果断加入了云知声,并有幸打造云知声第一款语音 AI 芯片。当初国内很少听到有专门设计AI芯片的公司和团队,市场更是见不到如今遍地开花、耳熟能详的 AI 芯片,所以我也算是国内最早接触 AI 芯片的一拨人。”海明回忆道。
他继续说道:“其实我最早接触 AI 是在 2006 年的时候,当初我们实验室做某种检测设备的师姐每天用酒精训练她的设备,出于好奇心,我不时的请教训练中的奥秘,也是从那一刻起我对 AI 的将来深信不疑,之后也接触到一些很有趣的机器视觉相关项目。这些经历或许和我后来选择从事 AI 芯片设计,并创立 AI 芯片公司有着千丝万缕的联系。”
译芯科技 demo演示
值得一提的是,2020 年 2 月,译芯科技已经完成了AIoT SoC芯片 FPGA 演示平台。与此同时,在此前集微网举办的“第二期芯力量&云路演”活动中,译芯科技还展示了其首款 AIoT 芯片的FPGA Demo,主要演示了通过语音识别控制照明系统的功能,包括开灯、关灯和调整灯光亮度等一系列控制命令词。
“FPGA Demo 的展示也意味着译芯科技并不是一家只讲故事的 AI 公司,更不是 PPT 芯片公司,我们确实在研发 AI 芯片产品。”海明进一步介绍道,目前译芯的 AI IP 已具备商业授权条件,AIoT SoC预计在 2020 年第 3 季度达到流片要求,预计 2020 年第 4 季度流片第一颗通用 AIoT 芯片。
首款 AI 芯片具备两大优势
“经过这几年的摸爬滚打,我对 AI 芯片的理解也在不断变化,其中最根本的变化是硬件优先到软件优先的变化,这种认知上的变化也是创立译芯科技的最根本的动力所在。”显然,对于 AI 芯片海明有着自己深刻的理解。
在海明的讲述中可以得知,其实海山最早也是这个观点:“不管是一个从事软件开发人员的偏执也好,还是高瞻远瞩也罢,他总是走在我前面,看在我前面,在我痴迷与打造 AI 芯片时,他已经着手筹备今天的 AI 编译器了。成立译芯科技的根基和信心来自于的 LLVM 编译器和 AI 编译器,我也坚信时间会证明这两个软件的价值,同时也证明译芯科技的存在价值。”
在海明看来,其实从 AI 概念爆发到现在,从 AI 芯片的竞争力的角度来说已经经历了从软件算法的性能优先到芯片架构优先,再到芯片成本优先三个阶段,而下一阶段应该是“成本+通用性”优先。只关注成本控制,不具备通用性的 AI 芯片,会继续以 turn-key 方式存在并出货,但不久的将来turn-key 方案会逐渐被低成本和通用性兼备的 AI 芯片所替代。因此海明认为,AI 芯片最终将从 turn-key 转为 turn-chip 方式出货。
在“turn-chip”的模式下,AI 芯片架构对算法研究人员或工程师来说是透明的,他们可以把 AI framework 打造的模型直接编译并烧写到 AI 芯片上,其与在 GPU 上开发 AI 应用一样便捷。而这也是译芯科技的终极目标:为芯片客户提供低成本且通用的 AI 芯片,不再让 AI 芯片的成本和 AI 算法移植过程,成为高性价比的 AI硬件产品开发的瓶颈。
基于此,译芯科技所研发的第一款 AI 芯片将具备两大优势:一是通用性强,二是性价比高。海明和海山选择开源免费的 RISC-V 作为基础处理器,对其进行 AI 指令扩展,并搭建了自己的 AI 处理器。最终,客户可借助译芯科技的 AI 编译器,将 AI 模型到 AI 硬件的繁琐人工优化工作变为简单的机器编译过程。因此,低成本和通用性是译芯 AI 芯片的核心竞争力。
坚持不同以往的 AI创业之路
“我们希望我们打造的是个‘AISP’芯片,也就是基于 AI 的信号处理器芯片。信号可以是语音、图像,也可以是传感器采集过来的任何一种类型的信号。希望一线的研发人员,就像使用 Matlab 开发 DSP 算法一样,采用Tensorflow、caffe、pytorch 等AI开发工具,开发其AI算法,并一键编译的形式将AI算法落地到我们的“AISP”芯片上,最终实现其硬件产品。”海明告诉集微网记者。
海明认为,AI 芯片投资最佳窗口已过,过去几年大量的公司将研发力量和资金投入到 AI 芯片架构设计和流片上,大家更关注芯片算力、能效比等硬性参数指标,而对AI软件工具的重视程度和研发投入远远不够。这直接导致了很多 AI 芯片面对 Google 和 NVIDA 的嵌入式边缘计算平台时黯然失色。
在 AI 的创业道路上,译芯科技显然要走一条与以往选手不同的道路。“我们强调的是芯片的通用性和低成本,我们不仅把有限的资源投入到降低芯片成本的探索上,就如我们正在打造的开源 SoC 平台,同样也会投入到工具软件的研发上,即我们的AI软件生态的构建和完善上面。”海明说道。
关于打造自主 IP 和开源 IP 为一体的 SoC 平台的必要性,海明说道:“随着芯片制造工艺的日益成熟,芯片制造成本不断降低,而随着社会的进步人力成本会越发昂贵,也就是芯片加工会变得越来越便宜,而芯片采用的IP成本有可能不降反而上升。另外,如今的芯片行业早已不是暴力行业,一款芯片的销量和所带来的利润远不及过去。这也对很多芯片厂商的成本控制能力提出了更高的要求。例如一个投入两三百万美元的芯片项目除了人力和芯片加工外所需的IP成本占总投入的一半以上,而其中前两者的降幅有限,所以成本控制主要体现在IP成本的控制上。这也是我们打造自主研发IP和开源IP为一体的SoC平台的目的。”
谈起创业过程,海明感慨万千,虽然创业不到一年,但经历的蛮多,除了兄弟二人无法左右的外部环境外,按照海明的话说:“万事开头难,何况我们的开头是技术瓶颈更高的编译器,市场不易打开的软件,竞争激烈的芯片,投资窗口已过的AI芯片。”
罗马非一日建成!如今的译芯科技还是一家刚成立不满一年的 AI 芯片初创企业,在竞争激烈的 AI 市场中仍然有很长的一段路要走。而在海明为公司设定的三年规划中,AI 终端芯片显然只是开始,未来公司还将涉入到 AI 云端芯片市场中,探索更多的可能性。
(校对/范蓉)
评论