[自评测] SupplyChainOS W3半决赛 — 客观评测报告 #2

Open
opened 2026-06-14 17:49:38 +08:00 by peakora66 · 1 comment
Owner

自评测报告:SupplyChainOS

评测对象:peakora66/s2w3 | 赛段:W3半决赛(跨境OPC加速赛) | 日期:2026-06-14


1. 项目理解

SupplyChainOS 定位为跨境供应链AI指挥塔,面向跨境OPC(One Person Company)卖家。项目核心逻辑:

问题:OPC卖家1人要管采购、质检、清关、物流、仓储、履约6个环节,传统需要5-6人团队,信息割裂、决策靠经验。

方案:5个AI Agent(采购/质检/清关/物流/指挥塔)+ 15个专业Skill,通过指挥塔仪表盘统一管控,让1人拥有6人团队的管控能力。

场景覆盖:从蓝牙耳机Pro/Lite、手机支架等6个SKU出发,覆盖从供应商搜索、比价、合同审查、验厂SOP、质检、HS编码、清关预检、路线规划、物流追踪、库存预测、补货建议、风险评估到供应链诊断的完整SOP。


2. 项目亮点

2.1 全链路闭环

  • 5个Agent覆盖采购到履约完整链路
  • 每个Agent串联2-4个Skill,形成完整工作流(如采购Agent:搜索到比价到评估到合同)
  • 指挥塔Agent可协调其他4个Agent协同工作

2.2 可视化指挥塔仪表盘

  • 打开即有数据:6产品库存概览 + 5仓库利用率 + 3条在途货物追踪 + 4条实时预警 + 供应商TOP3 + 财务概览
  • 2个ECharts图表:库存趋势折线图(93天3产品)+ 营收和利润趋势图
  • 供应链流程图:6环节彩色状态标识,点击可跳转Agent诊断
  • 3组运营场景数据(正常到压力到紧急)每10秒自动轮换

2.3 三级降级架构

  • GLM-5.1深度思考(reasoning_content)到reasoning提取到Smart Mock专业模板
  • LLM模式下真实推理,降级模式下也能提供专业结构化回复
  • 429限流指数退避加抖动重试,messages规范自动校验

2.4 AI+Skill分离架构

  • Skill层:15个独立签名统一的工具
  • Agent层:编排器根据消息关键词路由,先执行Skill再LLM解读
  • 架构解耦:Skill可独立测试、独立运行

3. 当前不足

3.1 数据真实性不足

  • 所有数据为JSON预置模拟数据,未对接真实ERP/物流API
  • 3组数据虽轮换但仍是静态场景切换,非实时动态数据流
  • 财务数据为估算值,缺乏实际业务数据支撑

3.2 LLM场景深度不够

  • GLM-5.1仅用于对话端的自然语言解读(Skill执行后解读结果)
  • 未在Skill执行层面使用LLM(如用LLM做真实的供应商搜索、HS编码推理)
  • Smart Mock模式下无AI推理,降级后全是预置模板

3.3 交互体验待优化

  • 右侧对话面板不支持多轮对话上下文(无session记忆)
  • 图表不支持交互筛选(如选日期范围、点击切换指标)
  • 移动端未适配(强制min-width:1920px)
  • 帮助中心为静态弹窗,无引导式教程

3.4 缺乏用户认证与数据隔离

  • 无登录/注册系统,所有用户共享同一份模拟数据
  • 无后台管理界面
  • 无API限流和权限控制

4. 建议

4.1 数据层增强(优先级高)

  • 对接真实物流API(如17TRACK)获取在途数据
  • 使用真实关税率数据库(如WTO Tariff Data)
  • 接入供应商开放数据(如1688 API)

4.2 LLM深度应用(优先级高)

  • 在Skill层使用LLM做真实推理(如LLM版HS编码匹配、LLM版供应商评估)
  • 增加多轮对话记忆(Redis + sessionId)
  • 支持用户上传文件(发票/箱单/合同),LLM解析提取

4.3 产品化完善(优先级中)

  • 用户认证系统 + 数据隔离
  • 引导式新手教程(非弹窗)
  • 移动端响应式适配
  • 图表交互增强(筛选/下钻/导出)

4.4 架构优化(优先级中)

  • 数据层从JSON文件迁移到SQLite/PostgreSQL
  • 添加API文档(Swagger/OpenAPI)
  • 添加用户行为埋点
  • 部署CI/CD流水线

5. 综合评价

评分

维度 评分 说明
项目完整性 8.5 5Agent+15Skill全链路闭环
技术实现 8.0 FastAPI + Vue3 + ECharts + GLM-5.1
UI/UX 7.5 暗色主题美观,交互流畅,引导偏少
AI应用深度 6.5 LLM仅用于解读层
数据真实度 5.0 全部模拟数据
可演示性 9.0 开箱即用,零配置演示
算力指南合规 9.0 完全遵循glm-5.1规范

总分:7.6/10

总结

SupplyChainOS 在W3半决赛阶段完成了完整的产品原型——从5个Agent编排、15个Skill实现到可视化指挥塔仪表盘和GLM-5.1真实推理接入。项目架构清晰(Skill到Agent到LLM三级分离),演示稳定性高(三级降级确保不中断),UI设计专业。

当前主要短板为数据真实度和AI应用深度,需在W4决赛阶段重点补强。建议优先:①对接真实数据API ②在Skill层引入LLM推理 ③完善用户认证和多轮对话。

# 自评测报告:SupplyChainOS > 评测对象:peakora66/s2w3 | 赛段:W3半决赛(跨境OPC加速赛) | 日期:2026-06-14 --- ## 1. 项目理解 SupplyChainOS 定位为跨境供应链AI指挥塔,面向跨境OPC(One Person Company)卖家。项目核心逻辑: **问题**:OPC卖家1人要管采购、质检、清关、物流、仓储、履约6个环节,传统需要5-6人团队,信息割裂、决策靠经验。 **方案**:5个AI Agent(采购/质检/清关/物流/指挥塔)+ 15个专业Skill,通过指挥塔仪表盘统一管控,让1人拥有6人团队的管控能力。 **场景覆盖**:从蓝牙耳机Pro/Lite、手机支架等6个SKU出发,覆盖从供应商搜索、比价、合同审查、验厂SOP、质检、HS编码、清关预检、路线规划、物流追踪、库存预测、补货建议、风险评估到供应链诊断的完整SOP。 --- ## 2. 项目亮点 ### 2.1 全链路闭环 - 5个Agent覆盖采购到履约完整链路 - 每个Agent串联2-4个Skill,形成完整工作流(如采购Agent:搜索到比价到评估到合同) - 指挥塔Agent可协调其他4个Agent协同工作 ### 2.2 可视化指挥塔仪表盘 - 打开即有数据:6产品库存概览 + 5仓库利用率 + 3条在途货物追踪 + 4条实时预警 + 供应商TOP3 + 财务概览 - 2个ECharts图表:库存趋势折线图(93天3产品)+ 营收和利润趋势图 - 供应链流程图:6环节彩色状态标识,点击可跳转Agent诊断 - 3组运营场景数据(正常到压力到紧急)每10秒自动轮换 ### 2.3 三级降级架构 - GLM-5.1深度思考(reasoning_content)到reasoning提取到Smart Mock专业模板 - LLM模式下真实推理,降级模式下也能提供专业结构化回复 - 429限流指数退避加抖动重试,messages规范自动校验 ### 2.4 AI+Skill分离架构 - Skill层:15个独立签名统一的工具 - Agent层:编排器根据消息关键词路由,先执行Skill再LLM解读 - 架构解耦:Skill可独立测试、独立运行 --- ## 3. 当前不足 ### 3.1 数据真实性不足 - 所有数据为JSON预置模拟数据,未对接真实ERP/物流API - 3组数据虽轮换但仍是静态场景切换,非实时动态数据流 - 财务数据为估算值,缺乏实际业务数据支撑 ### 3.2 LLM场景深度不够 - GLM-5.1仅用于对话端的自然语言解读(Skill执行后解读结果) - 未在Skill执行层面使用LLM(如用LLM做真实的供应商搜索、HS编码推理) - Smart Mock模式下无AI推理,降级后全是预置模板 ### 3.3 交互体验待优化 - 右侧对话面板不支持多轮对话上下文(无session记忆) - 图表不支持交互筛选(如选日期范围、点击切换指标) - 移动端未适配(强制min-width:1920px) - 帮助中心为静态弹窗,无引导式教程 ### 3.4 缺乏用户认证与数据隔离 - 无登录/注册系统,所有用户共享同一份模拟数据 - 无后台管理界面 - 无API限流和权限控制 --- ## 4. 建议 ### 4.1 数据层增强(优先级高) - 对接真实物流API(如17TRACK)获取在途数据 - 使用真实关税率数据库(如WTO Tariff Data) - 接入供应商开放数据(如1688 API) ### 4.2 LLM深度应用(优先级高) - 在Skill层使用LLM做真实推理(如LLM版HS编码匹配、LLM版供应商评估) - 增加多轮对话记忆(Redis + sessionId) - 支持用户上传文件(发票/箱单/合同),LLM解析提取 ### 4.3 产品化完善(优先级中) - 用户认证系统 + 数据隔离 - 引导式新手教程(非弹窗) - 移动端响应式适配 - 图表交互增强(筛选/下钻/导出) ### 4.4 架构优化(优先级中) - 数据层从JSON文件迁移到SQLite/PostgreSQL - 添加API文档(Swagger/OpenAPI) - 添加用户行为埋点 - 部署CI/CD流水线 --- ## 5. 综合评价 ### 评分 | 维度 | 评分 | 说明 | |------|------|------| | 项目完整性 | 8.5 | 5Agent+15Skill全链路闭环 | | 技术实现 | 8.0 | FastAPI + Vue3 + ECharts + GLM-5.1 | | UI/UX | 7.5 | 暗色主题美观,交互流畅,引导偏少 | | AI应用深度 | 6.5 | LLM仅用于解读层 | | 数据真实度 | 5.0 | 全部模拟数据 | | 可演示性 | 9.0 | 开箱即用,零配置演示 | | 算力指南合规 | 9.0 | 完全遵循glm-5.1规范 | **总分:7.6/10** ### 总结 SupplyChainOS 在W3半决赛阶段完成了完整的产品原型——从5个Agent编排、15个Skill实现到可视化指挥塔仪表盘和GLM-5.1真实推理接入。项目架构清晰(Skill到Agent到LLM三级分离),演示稳定性高(三级降级确保不中断),UI设计专业。 当前主要短板为数据真实度和AI应用深度,需在W4决赛阶段重点补强。建议优先:①对接真实数据API ②在Skill层引入LLM推理 ③完善用户认证和多轮对话。
Author
Owner

自评测反馈 — 已完成优化

基于Issue #2指出的不足,已完成以下3项针对性优化:

1. 多轮对话记忆(补交互体验短板)

  • chat_route 新增 session 上下文管理,存储最近3轮对话历史
  • _smart_reply 新增 history 参数,回复开头带"(接上文:xxx...)"上下文提示
  • 对话更连贯,不再是每次独立回答

2. 引导式新手教程(补引导不足短板)

  • 顶栏新增「🚀 新手引导」按钮
  • 5步引导覆盖:欢迎介绍 → 指挥塔总览6面板 → Agent工作台 → 对话面板 → 完成
  • 每一步有高亮框和具体操作说明
  • 首次加载自动弹出,可跳过或逐级查看

3. 图表交互增强(补交互不足短板)

  • 趋势图(库存/营收):点击数据点自动触发"查看xxx的趋势"分析
  • Agent饼图:点击饼图扇区触发"分析xxx的情况"
  • Skill图表:点击柱状图触发对应分析

剩余待优化(W4阶段)

  • 数据真实性:需对接真实物流/关税率 API(17TRACK, WTO Tariff)
  • Skill层LLM:需将LLM用于实际供应商搜索/HS编码推理
  • 用户认证:需搭建登录系统和数据隔离
  • 移动端适配:需移除 min-width:1920px 强制
## 自评测反馈 — 已完成优化 基于Issue #2指出的不足,已完成以下3项针对性优化: ### ✅ 1. 多轮对话记忆(补交互体验短板) - `chat_route` 新增 session 上下文管理,存储最近3轮对话历史 - `_smart_reply` 新增 `history` 参数,回复开头带"(接上文:xxx...)"上下文提示 - 对话更连贯,不再是每次独立回答 ### ✅ 2. 引导式新手教程(补引导不足短板) - 顶栏新增「🚀 新手引导」按钮 - 5步引导覆盖:欢迎介绍 → 指挥塔总览6面板 → Agent工作台 → 对话面板 → 完成 - 每一步有高亮框和具体操作说明 - 首次加载自动弹出,可跳过或逐级查看 ### ✅ 3. 图表交互增强(补交互不足短板) - 趋势图(库存/营收):点击数据点自动触发"查看xxx的趋势"分析 - Agent饼图:点击饼图扇区触发"分析xxx的情况" - Skill图表:点击柱状图触发对应分析 ### ⏳ 剩余待优化(W4阶段) - 数据真实性:需对接真实物流/关税率 API(17TRACK, WTO Tariff) - Skill层LLM:需将LLM用于实际供应商搜索/HS编码推理 - 用户认证:需搭建登录系统和数据隔离 - 移动端适配:需移除 min-width:1920px 强制
Sign in to join this conversation.
No labels
No milestone
No project
No assignees
1 participant
Notifications
Due date
The due date is invalid or out of range. Please use the format "yyyy-mm-dd".

No due date set.

Dependencies

No dependencies set.

Reference
peakora66/s2w3#2
No description provided.