嵌入式领域正迎来一场前所未有的变革,开发者正以前所未有的技术实力,在小型低功耗系统中实现强大的AI应用,重塑着语音、视觉和振动等领域的智能交互方式。 曾经的连接设备正蜕变为能够自主决策的智能系统,这种将数据处理能力前移至数据源端的“边缘化”趋势,正成为加速决策、减少延迟、保障数据隐私、降低成本和提升能效的关键。
边缘计算:应对高性能需求的必然选择
工业自动化、机器人、智慧城市、家居自动化等应用场景对边缘计算的性能和功能提出了更高的要求。与过去简单、互不连接的传感器不同,如今的嵌入式系统正集成人工智能(AI)和机器学习(ML)技术,赋予端侧设备自主决策的能力,远超传统简单控制算法的范畴。
AI时代通用处理器演进:从逻辑控制到推理核心
早期的软件开发以逻辑和控制算法为核心,而数字信号处理(DSP)算法的出现,为增强型语音、视觉和音频应用奠定了基础。如今,我们已进入一个以推理为核心的新时代,这带来了对计算性能、能效、延迟、实时处理和可扩展性方面全新的、更高的需求。
行业迫切需要通用处理器能力的提升,以实现直播视频中的特征检查或人物检测等高级应用,同时需要处理器加速器提供必要的平衡。例如,过去需要基于频率的滤波器来构建噪声消除应用,如今则可以通过将滤波与ML/AI模型相结合,大幅提升性能和功能。为了应对这些复杂任务,对处理器和开发工具的需求也在日益增长。
ML驱动的演进:挑战与突破
ML正以前所未有的力量驱动着边缘计算的演进,但同时也伴随着技术挑战。行业正在转变物联网开发模式,以期实现规模化扩展。
目前,开发者正利用安全且性能增强的技术,在小型低功耗嵌入式系统中赋能语音、视觉和振动等 heretofore unforeseen applications。未来,各种版本的编程语言和Transformer模型将在具备全新计算能力的物联网边缘设备中扮演重要角色,为开发者带来无限可能。
Arm Helium™:为嵌入式ML注入强劲动力
为了满足开发者对硬件的需求,Arm在Armv8.1-M架构中引入了Arm® Helium™矢量处理技术。Helium显著提升了小型低功耗嵌入式设备的ML和DSP应用性能,并提供单指令多数据 (SIMD) 功能,将Arm Cortex®-M设备的性能提升至全新水平,支持预测性维护和环境监控等应用。
Helium能够加快信号调节(如滤波、噪声消除、回声消除)和特征提取(音频或像素数据)的速度,从而能够更高效地将数据传输到采用神经网络处理器的分类器中,显著提高了DSP和ML性能。
智能边缘生态系统:生态伙伴的协同
众多Arm的合作伙伴正在其最新产品中集成Helium技术,赋能开发者在网络最远端的受限设备上利用ML的优势。
• Cortex-M55处理器: Arm于2020年推出,Alif Semiconductor于2021年推出了首款基于Cortex-M55的芯片,并在其产品系列中部署了搭载Helium的Cortex-M55。奇景光电(Himax)也将其AI处理器应用于电池供电的物联网设备中的计算机视觉系统。
• Cortex-M85处理器: Arm于2022年推出,是第二款支持Helium的CPU。瑞萨电子的RA MCU技术结合Plumerai的推理引擎,大大加快了人物检测等应用的速度,确保客户可以使用更庞大、更准确的AI模型,并延长电池续航。
• Cortex-M52处理器: Arm于2023年推出,是第三款采用Helium技术的CPU,专为AIoT应用设计,可在端点部署更密集的ML推理算法,即使没有专用NPU也能实现显著的性能提升。
软件与开发工具的协同演进
随着硬件的飞速发展,软件复杂性日益增加,需要新的开发流程来创建优化的ML模型和高效的设备驱动程序。
• 先进的开发工具: Arm及第三方提供了多种工具支持AI算法的开发。数据科学家可以在离线环境中创建模型,并使用相应工具进行优化,使其能在Arm Ethos™-U NPU或基于Cortex-M的处理器(利用Helium指令)上运行。
• 端到端ML自动化: Qeexo的AutoML平台为边缘设备提供了端到端ML自动化,简化了传感器数据收集、清理、可视化以及ML模型构建过程。
• 集成开发流程: Keil MDK等传统嵌入式工具为MLOps工具提供了补充,并与DevOps流程结合,最终将嵌入式、物联网和AI应用程序整合到单一的开发流程中,使得软件开发者能够熟练运用。
展望未来:释放边缘潜力,平衡关键要素
边缘的巨大潜能正在被逐步发掘,对微控制器性能的需求不断增长,特别是在声控门锁、人物检测识别、预测性维护的联网电机控制等高端AI和ML应用领域。
通过正确技术的赋能,开发者能够重新构想边缘和端侧设备,在性能、成本、能效和隐私等受限设备中的关键要素之间取得最佳平衡,从而推动未来的嵌入式开发实现真正意义上的AI计算应用。