机器人运营
机器人运营 专注于机器人在生产环境上线后的日常工作流。此阶段的目标是保持高可用性、确保作业安全,并通过数据回顾驱动能力的持续改进。

值班建议流程
Section titled “值班建议流程”结构化的运营流程可以确保在潜在问题影响业务之前被发现。
- 机队巡检:查看全局机器人列表,关注在线状态、心跳新鲜度和活跃的异常标记。
- 健康下钻:对于关键设备,查看其 CPU 负载、内存占用、磁盘空间和网络延迟等实时指标。
- Teleops 校验:定期打开 Teleops 校验视频流和传感器数据。进行短时间的人工接管测试,确保动作响应正常。
- 事后复盘:分析最近的对话日志、场景执行结果,并利用“回放”功能查看事件时间线,找出任何偏离预期行为的根本原因。
高优先级指标
Section titled “高优先级指标”跟踪这些 KPI 以衡量机器人机队的健康状况和效率:
- 在线率 (Availability):计划在线时长与实际在线时长的比例。
- 传感器可靠性:视频和感知流完全正常运行的时间百分比。
- 执行成功率:自动化指令和场景切换的成功率。
- MTTR (平均恢复时长):故障或警报后,将机器人恢复服务所需的平均时间。
当机器人遇到无法自主解决的边界情况时,操作员可以通过 Teleops 进行干预。这种“人机协作”模式确保了作业安全,同时也让系统能从人工修正中持续学习。