跳转到内容

机器人运营

机器人运营 专注于机器人在生产环境上线后的日常工作流。此阶段的目标是保持高可用性、确保作业安全,并通过数据回顾驱动能力的持续改进。

机器人列表页面:状态和快速入口
机器人列表:开始值班前,先进行快速的机队健康扫描

结构化的运营流程可以确保在潜在问题影响业务之前被发现。

  1. 机队巡检:查看全局机器人列表,关注在线状态、心跳新鲜度和活跃的异常标记。
  2. 健康下钻:对于关键设备,查看其 CPU 负载、内存占用、磁盘空间和网络延迟等实时指标。
  3. Teleops 校验:定期打开 Teleops 校验视频流和传感器数据。进行短时间的人工接管测试,确保动作响应正常。
  4. 事后复盘:分析最近的对话日志、场景执行结果,并利用“回放”功能查看事件时间线,找出任何偏离预期行为的根本原因。

跟踪这些 KPI 以衡量机器人机队的健康状况和效率:

  • 在线率 (Availability):计划在线时长与实际在线时长的比例。
  • 传感器可靠性:视频和感知流完全正常运行的时间百分比。
  • 执行成功率:自动化指令和场景切换的成功率。
  • MTTR (平均恢复时长):故障或警报后,将机器人恢复服务所需的平均时间。

当机器人遇到无法自主解决的边界情况时,操作员可以通过 Teleops 进行干预。这种“人机协作”模式确保了作业安全,同时也让系统能从人工修正中持续学习。