【S2W3 交叉评测】SupplyChainOS 跨境供应链AI指挥塔 — 反馈与建议 #3
Loading…
Add table
Add a link
Reference in a new issue
No description provided.
Delete branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
一、项目总览
┌──────────────┬─────────────────────────────────────────────────────────────────────────────────────────┐
│ 维度 │ 评价 │
├──────────────┼─────────────────────────────────────────────────────────────────────────────────────────┤
│ 定位 │ 面向跨境 OPC(一人公司)卖家的 AI 供应链指挥塔,覆盖采购→质检→清关→物流→仓储→履约全链路 │
├──────────────┼─────────────────────────────────────────────────────────────────────────────────────────┤
│ 核心价值主张 │ 「1 人 + 5 个 AI Agent = 6 人供应链团队」 │
├──────────────┼─────────────────────────────────────────────────────────────────────────────────────────┤
│ 产品形态 │ FastAPI 后端 + Vue 3 单页前端 + WebSocket 实时对话 + ECharts 可视化 │
├──────────────┼─────────────────────────────────────────────────────────────────────────────────────────┤
│ AI 能力 │ 接入 Synnovator GLM-5.1,但当前默认走 Smart Mock 三级降级 │
├──────────────┼─────────────────────────────────────────────────────────────────────────────────────────┤
│ 完成度 │ W3 半决赛 Demo 完整可跑,15 Skill + 5 Agent + 仪表盘 + 对话交互均已落地 │
└──────────────┴─────────────────────────────────────────────────────────────────────────────────────────┘
────────────────────────────────────────────────────────────────────────────────
二、评分(满分 10 分)
┌────────────────────┬──────────┬───────────────────────────────────────────────────────────────────┐
│ 评测维度 │ 得分 │ 说明 │
├────────────────────┼──────────┼───────────────────────────────────────────────────────────────────┤
│ 市场与痛点 │ 8.5 │ 跨境电商供应链黑盒是真实痛点,OPC 卖家付费意愿可被验证 │
├────────────────────┼──────────┼───────────────────────────────────────────────────────────────────┤
│ 产品与 UX │ 8.0 │ 仪表盘、Agent 工作台、Skill 工具箱、对话面板四位一体,交互完整 │
├────────────────────┼──────────┼───────────────────────────────────────────────────────────────────┤
│ AI 与技术深度 │ 6.0 │ 架构合理,但当前大量依赖规则匹配和静态 Mock,真实 AI 推理深度有限 │
├────────────────────┼──────────┼───────────────────────────────────────────────────────────────────┤
│ 商业化可行性 │ 6.5 │ SaaS 定价清晰,但缺少客户获取、留存、数据壁垒的分析 │
├────────────────────┼──────────┼───────────────────────────────────────────────────────────────────┤
│ 工程落地与可扩展性 │ 6.0 │ MVP 可用,但缺数据库、多租户、真实 API 集成、安全认证 │
├────────────────────┼──────────┼───────────────────────────────────────────────────────────────────┤
│ 文档与演示 │ 8.0 │ README/SPECS/DEMO/ADR 齐全,测试全部通过 │
├────────────────────┼──────────┼───────────────────────────────────────────────────────────────────┤
│ 综合得分 │ 7.0 / 10 │ B+:方向清晰、Demo 出彩,但 AI 硬核度和工程深度仍需补强 │
└────────────────────┴──────────┴───────────────────────────────────────────────────────────────────┘
────────────────────────────────────────────────────────────────────────────────
三、优势亮点
• 抓住了跨境电商 OPC 卖家「供应链黑盒、采购靠直觉、清关靠运气」的真实痛点。
• 「1 人 + 5 Agent」的口号简洁有力,易于评委和投资人理解。
• 前端使用 Vue 3 + ECharts 全自定义 CSS,暗色科技风仪表盘视觉效果专业。
• 三大核心界面(指挥塔总览 / Agent 工作台 / Skill 工具箱)+ 右侧实时对话,信息架构清晰。
• 3 组运营数据(正常 / 压力 / 紧急)每 10 秒自动轮换,能有效展示系统在不同状态下的响应。
• 新手引导 5 步教程、帮助中心、流程图点击跳转等细节体现了产品化思维。
• Skill 执行层 → Agent 编排层 → LLM 解读层 的分层解耦做得不错。
• 15 个 Skill 全部实现并通过单元测试,5 个 Agent 也通过了集成测试。
• LLMClient 遵循了算力平台使用指南:消息校验、JSON 模式、reasoning_content 解析、429 指数退避 + 抖动重试、流式/非流式双模式。
• Mock-first → LLM 真实接入的演进路径在 ADR 中解释清楚。
• Smart Mock 保证 Demo 稳定、零成本,适合比赛演示。
────────────────────────────────────────────────────────────────────────────────
四、不足与风险
这是最大风险。项目文档中多次强调:
│ 「LLM 理解产品描述 → 语义搜索供应商库」「LLM 推理 HS 编码分类路径」「LLM 综合运价/时效/港口拥堵推理最优路线」
但代码实现上:
• sourcing_search.py 只是简单的 product.lower() in s.get("product", "").lower() 子串匹配。
• customs_hscode.py 只是统计关键词命中数。
• warehouse_forecast.py 直接读取 inventory.json 中预置的 forecast 字段。
• 对话回复在无 API Key 时完全依赖 llm_client.py 中的硬编码模板。
评委视角:这更像是一个「规则引擎 + LLM 润色层」,而不是真正的 AI 原生应用。如果比赛强调 AI 能力,这一点会被重点追问。
• 供应商、库存、路线、HS 编码全部来自本地 JSON 文件。
• 没有接入 1688/阿里巴巴、Amazon SP-API、海关数据、物流追踪 API(如 17track)、海外仓 WMS 等。
• 所谓的「实时追踪」「库存预测」都是基于预设数据,无法反映真实业务波动。
• 没有数据库,没有用户认证,没有多租户隔离。
• CORS allow_origins=["*"] 且接口无鉴权,API Key 防盗用仅通过屏蔽 .env.local 路径实现,安全性较弱。
• 前端所有逻辑塞在一个 index.html(856 行),CSS/JS/HTML 未拆分,后续维护成本高。
• Docker 配置存在口径不一致:README 启动端口是 7860,Dockerfile 暴露的是 8000。
• 定价表完整,但未说明:
• 客户如何获取(CAC)?
• 相比 Shopify 生态、赛狐、马帮等已有供应链 SaaS 的差异化在哪?
• 供应商推荐佣金的法律合规性与供应商入驻逻辑。
• 数据服务卖给谁、以什么形式交付。
• 20 个测试全部通过值得肯定,但断言多为 r["count"] >= 3、"recommendation" in r 等结构性检查。
• 没有评估推荐质量、HS 编码准确率、补货建议合理性等关键业务指标。
────────────────────────────────────────────────────────────────────────────────
五、改进建议(按优先级)
短期(比赛前可落地)
• 将关键词匹配替换为基于 Embedding 的语义匹配,或至少让 LLM 参与 HS 编码/供应商推荐理由生成。
• 在 demo 中默认启用 LLM(配置好 Key),让评委看到真实推理过程,而不是 Smart Mock 模板。
• 例如物流追踪接入公开 API 或模拟一个真实的承运商接口,让「在途货物」不再只是前端写死的数据。
• 修复 Docker 端口不一致。
• 增加接口鉴权或演示模式开关。
• 将前端代码按组件/页面拆分。
中期(产品化方向)
• 引入数据库(PostgreSQL/MongoDB),支持多租户、历史订单、供应商绩效沉淀。
• 用真实销量数据训练/微调库存预测模型,而不是读 JSON。
• HS 编码准确率、供应商推荐采纳率、补货建议 ROI、清关延误降低比例等,用数据证明「降本 15%、清关时效 ↓40%」不是口号。
• 是行业 Know-how(海关规则库、产业带供应商网络)?还是数据飞轮(用客户数据优化预测)?需要在路演中讲清楚。
────────────────────────────────────────────────────────────────────────────────
六、结论
SupplyChainOS 是一个方向正确、Demo 完整、叙事清晰的项目。 它在比赛场景下很有竞争力:痛点真实、界面专业、15 Skill + 5 Agent 全部跑通、测试全绿。
但如果以「AI 原生创业团队」的标准衡量,当前的 AI 主要停留在「规则 + 模板」层面,真实推理和数据闭环尚未建立。建议在路演中诚实呈现当前是「Mock-first
MVP」,并清晰规划下一阶段如何接入真实数据、提升模型决策占比。
最终建议:入围决赛的有力竞争者,但需要在 AI 硬核度和工程可扩展性上继续补强,才能从「好 Demo」升级为「好产品」。
感谢 @tony203 的详细评测!已根据反馈完成本轮迭代,以下是逐项回应:
一、关于"AI含量不足"
问题原文:Skill层全靠规则/子串匹配,非真正LLM推理
已完成的优化:5个核心Skill接入LLM推理增强,采用「规则先行 + LLM增强 + 优雅降级」架构:
实现细节:
🤖 AI分析/建议/诊断输出(测试日志中有展示)二、关于"数据全部Mock"
问题原文:未接入真实数据源
说明:当前阶段为MVP Demo验证,JSON Mock数据用于快速验证产品逻辑和交互流程。真实数据源接入需要API对接(物流追踪API、海关数据API、供应商平台API等),这属于W4决赛阶段「产品化部署」的工作,当前阶段优先验证AI推理链路和用户体验。
已在 SPECS.md §6.4 明确列出后续数据接入方向。
三、关于"工程深度不够"
问题原文:Docker端口不一致、无鉴权、前端单文件
已完成的优化:
X-API-Key/Authorization: Bearer两种方式;未配置API_KEY时自动跳过(开发模式);公开路径和WebSocket免鉴权四、关于"测试只检查结构不检查质量"
问题原文:测试只检查返回字段是否存在,不验证内容质量
已完成的优化:测试从20个结构检查升级为47个校验点,新增质量断言:
运行结果:47/47 校验点全部通过 ✅
五、关于"商业模式偏乐观"
问题原文:SaaS定价和佣金模式过于乐观
已完成的优化:SPECS.md §9 商业模型已重新分为三阶段:
提交记录:commit
0d7c961— 已推送到peakora66/s2w3main分支再次感谢 @tony203 的专业评测,这些反馈对项目质量提升很有帮助!