工业机器人,作为自动化生产的基石,正经历着一场由人工智能驱动的深刻变革。传统上,机器人的每一次精进,都离不开工程师们“in-the-loop”的深度参与——他们需要亲手编写代码,对复杂的流程进行细致的调整与优化。然而,随着像 ChatGPT 这样的大型语言模型 (LLM) 的崛起,我们正目睹一场Shift,从“in-the-loop”到**“on-the-loop”**的范式转移,这预示着人机协作的新纪元。
从“圈内人”到“圈外指导者”:ChatGPT 赋能的“On-the-Loop”
过去,机器人流程的改进如同精密的齿轮组,需要专家的“in-the-loop”才能精准调校。工程师必须深入代码层面,理解每一个指令的含义,才能实现流程的优化。这不仅需要高度专业的技术知识,也限制了普通用户参与改进的可能。
而今,ChatGPT 的出现,彻底改变了这一局面。它使得任何人,无论技术背景深浅,都能以**“on-the-loop”的姿态,与机器人系统进行高效对话。通过高级的自然语言指令**,用户可以像与一位经验丰富的助手沟通一样,指挥和优化复杂的机器人流程,实现无缝部署于各类平台与任务。这不仅仅是便利性的提升,更是智能制造 democratization 的重要一步。
人类在 AI 驱动机器人流程中的核心角色:质量与安全守护者
尽管 AI 强大,人类的智慧与判断力仍然是不可或缺的。在 ChatGPT 赋能的机器人流程中,人类的角色发生了转变,更加聚焦于评估输出质量与保障运行安全。您的核心任务包括:
1. 定义通用型机器人函数库(High-Level Robot Function Library):
这是连接人、AI 与物理世界的桥梁。一方面,这个库需要面向机器人平台,能够清晰地调用和指导机器人执行特定的动作,例如“移动到坐标 X, Y”、“抓取目标对象”等。另一方面,它也面向 ChatGPT,要求函数的命名和描述都应直观易懂,便于 AI 理解和遵循。一个精心设计的函数库,是 ChatGPT 稳定高效工作的基石。
2. 精准构建 prompt(任务指令):
prompt,就是用户对 AI 下达的“命令”。一个优质的 prompt,不仅要清晰地描述任务目标,还要能标识出函数库中最适合执行任务的函数。更进一步,它还可以包含约束信息,例如“动作速度不得超过每秒 1 米”、“仅使用视觉传感器”等,或者指导 ChatGPT 如何组织其响应,例如“用 Python 语言返回代码”、“以 JSON 格式输出结果”等。
3. 评估与反馈:迭代优化的关键
AI 的输出并非总是完美。在“on-the-loop”模式下,您需要通过直接分析,或在模拟环境中进行评估 ChatGPT 生成的代码。这包括检查代码的逻辑是否正确、指令是否清晰、是否存在潜在的安全隐患。一旦发现问题,您需要向 ChatGPT 提供具体的反馈,指出需要改进的地方。这种**“分析-反馈-修正”**的循环,是确保 AI 输出符合人类期望的必由之路。
4. 持续迭代,直至完美部署:
并非所有任务都能一次性完美解决。对于复杂的机器人控制任务,可能需要多次迭代。用户通过持续的文本反馈,“教授”AI 改进其代码,直到生成的结果完全符合人类的预期,并且能够安全、可靠地部署到真实的机器人硬件上执行。
简单任务的“零样本”能力:AI 的初步展现
ChatGPT 的强大之处在于,即便在**“零样本”(Zero-Shot)的情况下,也能解决一系列简单的机器人任务。这意味着,当用户提供清晰的 prompt 和函数库描述后,无需任何代码示例,ChatGPT 就能自行推理并生成解决方案。
• 时空推理与视觉伺服: 想象一下,您只需告诉 ChatGPT:“控制一个平面机器人,使用视觉伺服捕捉篮球的位置。” AI 便能独立思考,生成控制机器人进行精确定位的代码。
• 真实世界无人机操控: 通过 API,您可以要求 ChatGPT 控制一架真实的无人机,执行“物体寻找”任务。AI 将根据指令,规划飞行路径,调用摄像头传感器,完成搜寻目标。
• AirSim 模拟器中的工业检测: 在 AirSim 这样的模拟环境中,ChatGPT 同样可以控制模拟无人机进行工业巡检,例如检测管道的损坏、识别设备故障等,为实际应用提供宝贵的经验。
复杂任务的“On-the-Loop”协同:AI 的深度进化
对于更复杂的机器人控制任务,ChatGPT 的“零样本”能力可能显得不足。此时,“on-the-loop”的模式便展现出其真正的价值。通过文本反馈的交互方式,人类用户可以与 ChatGPT 协同进化,共同攻克难关。
• 课程学习式技能构建: 用户可以“教授” ChatGPT 简单的机器人技能,例如“拾取和放置物体”。一旦 AI 掌握了基础技能,用户再将其逻辑组合,用于完成更复杂的任务,如“按照特定图案排列积木”。
• AirSim 复杂的避障策略: 在 AirSim 模拟器中,一个需要无人机进行复杂避障的任务。ChatGPT 可能能够构建大部分的算法模块,但关键的决策信息,例如无人机的精确朝向、最优的避障路径等,仍需要人类的反馈。而这些反馈,即便以高级的自然语言形式给出,ChatGPT 也能准确理解,并在适当的位置进行代码修正,从而完成高难度的避障任务。
行业巨头的积极拥抱:ABB 的 AI 赋能实践
纵观工业机器人领域,AI 的应用仍处于探索阶段,但已开始在智能识别和智能编程等环节发挥重要作用。ABB,作为行业的领军者,正积极拥抱这一变革,通过技术创新,推动机器人智能化迈入新高度。
• 人工智能驱动的拣选解决方案: ABB 的人工智能机器人物品拣选器,正赋能电商物流领域。随着全球电子商务的迅猛增长,对物流自动化效率提出了更高要求。ABB 与硅谷人工智能初创公司 Covariant 建立合作伙伴关系,结合 Covariant 的通用人工智能技术(Covariant Brain),使机器人能够通过强化学习,在复杂的、非结构化的环境中,自行适应新任务,并识别和抓取更多种类的物品。这种解决方案已经在荷兰电商服务领先提供商 Active Ants 进行了成功部署,大幅提升了拣选效率和准确性。
• AI 与机器视觉重塑灵巧性: ABB 致力于赋予机器人“人类般的灵巧性”。通过结合先进的机器视觉和人工智能,其物品拾取器能够在非结构化的仓库和履行中心环境中,准确识别和拾取物品。AI 可以实时确定最佳抓取点,不论物品的形状、大小和摆放方式如何,都能实现高精度拣选,准确率超过 99.5%,每小时可处理多达 1,400 个未分类的物品。该系统已适配 IRB1200、IRB 1300 和 IRB 2600 等多种 ABB 机器人型号。
• 与微软合作,生成式 AI 赋能工业分析: ABB 携手微软,将生成式 AI 整合进其工业数字化解决方案,特别是ABB Ability™ Genix™ 工业分析和 AI 套件。通过集成Copilot 功能,利用Azure OpenAI 服务(包括 GPT-4 等大型语言模型),ABB 实现了代码、图像和文本的自动生成,从而使工业数据分析更加直观、易用。集成了 AI 的 Genix Copilot 应用,能够简化关联数据的流转,为行业管理者、专家提供实时、可执行的洞见,从而改善决策质量,提升生产力。据 ABB 披露,这些洞察有望将资产生命周期延长高达 20%,并将意外停机时间减少多达 60%。
结语:拥抱智能,共塑未来
ChatGPT 所代表的生成式 AI 技术,正以前所未有的方式重塑着机器人行业的格局。它不仅降低了人机交互的门槛,更将人类从繁琐的代码编写中解放出来,让我们能够专注于更高层次的策略制定、质量控制和安全保障。从“in-the-loop”到“on-the-loop”的转变,是机器人智能化进程中的一次历史性飞跃。随着 AI 技术的不断进步和应用场景的持续拓展,我们有理由相信,一个更加智能、高效、安全的机器人时代正向我们加速走来。ABB 等行业先行者正在引领这场变革,为全球制造和物流业的转型注入强大动力。