混合式AI解锁生成式AI的未来
本文叙述混合型是AI的未来第一部分:透过装置上AI与混合式AI实现生成式AI的扩展。 随着生成式人工智能(AI)的采用速度出现破纪录的成长、以及运算需求增加,混合处理的重要性更不可同日而语。然而,如同传统运算从大型主机和精简型计算机发展到当前的云端和边缘装置混合一样,AI处理也必须在云端和装置间进行妥善的分配,才能扩展并充分发挥潜力。
混合的AI架构不是只在云端进行处理,而是在云端和边缘装置之间分配并协调AI工作负载。云端和边缘装置—智能型手机、汽车、个人计算机和物联网装置—共同合作,能提供更强大、高效和充分优化的AI功能。
主要的动机是节省成本。以每一笔搜寻的成本为例,相较于传统的搜寻方法,使用以生成式AI为基础的搜寻成本估计会增加10倍—而这还只是生成式AI的众多应用之一。
混合式AI将使生成式AI开发人员和供货商能够利用边缘装置中的运算能力来降低成本。此外,混合的AI架构(或仅在装置上运行AI)在全球范围提供效能、个人化、隐私和安全方面额外的优势。
这些架构可以有不同的卸除选项,根据模型和查询复杂性等要素在云端和装置间分配处理工作。例如,如果模型大小、提示(prompt)和生成长度小于特定阈值,并提供可接受的精确度,便能完全在装置上运行推理。如果任务较为复杂,模型可以跨云端和装置之间运行。
混合式AI甚至能让装置和云端同时运行模型—装置运行模型的轻量版,而云端同时处理完整模型的多个代码(token),并在需要时修正装置答案。
图二 : 在以装置为中心的混合AI架构中,云端仅用于卸除装置无法充分执行的 AI 任务。
藉由边缘装置扩展生成式AI
随着强大的生成式AI模型变得越来越小,装置上的处理能力不断提升,混合式AI的潜力也更进一步的成长。具有超过10亿个参数的AI模型已经能在效能和精确度水平与云端相近的手机上运行;而在不久的将来,有100亿个参数以上的模型预计也将能在装置上运行。
混合的AI作法几乎适用于所有生成式AI应用和装置类型,包括手机、笔记本电脑、延展实境头戴式装置、汽车和物联网。对于全球生成式AI的扩展以及满足企业和消费者需求而言,这样的作法相当关键。我们坚信,混合型就是AI的未来。
(本文作者为高通技术公司产品管理资深副总裁Ziad Asghar、高通技术公司工程部门副总裁Jilei Hou)
评论