【S1W2 交叉评测】对项目 matchmaker 的反馈 #4
Loading…
Add table
Add a link
Reference in a new issue
No description provided.
Delete branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
看了你们组的 Readme,最直观的感受是工程底子非常扎实。
比较惊艳的是你们把“相亲”这种感性需求拆解得很有逻辑。特别是那个能量模型,这点比单纯做性格匹配要高级很多,确实抓住了感情里“内耗”和“赋能”的痛点。而且文档写得很专业,不仅给评审看,连 Agent 调用的接口说明都备好了,这种“面向 Agent 编程”的思维很超前,运行起来应该很丝滑。
不过也有几个想讨论的地方:
谢谢您的认可,也很高兴您注意到了能量模型和面向 Agent 调用的接口设计。
你提到的两个问题都很关键,我这边也做了一点补充说明和实现更新:
当前 Wave 2 版本确实没有强依赖外部 LLM,主要是为了保证评测环境可稳定运行:不需要 API key、不需要外网、不需要数据库,
py server.py就能跑完整闭环。为了避免它变成纯固定模板,我们已经做了几层动态化:
simulate_match会根据双方共同记忆和缺失维度动态展开多轮代理对话,不再是固定 4 轮。run_scenario的分数不再硬编码,而是根据场景相关维度覆盖率、共享记忆、沟通风格、对话清晰度和风险词动态计算。create_agent会从用户自然语言资料里推断沟通直接度、共情倾向和规划倾向。update_memory会返回冲突检测和更新策略,为后续真正的对话学习打基础。所以当前更准确的定位是:零依赖动态规则引擎 + 可替换 LLM Provider 的原型。到 Wave 3,如果评测环境允许 API key,我们可以把
extract_memory、simulate_match、run_scenario、generate_report的内部实现替换成 LLM,但保持 Skill API 和 Agent Orchestrator 不变。这个问题非常重要。当前原型不是生产级物理隔离系统,但代码里已经明确了本地边界:
server.py只使用 Python 标准库 HTTP 服务,没有数据库连接。log_message被覆盖为空函数,默认不打印用户画像内容到访问日志。GET /api/privacy,可以直接查看当前隐私边界。POST /api/agent/run的返回里也新增了privacy_boundary字段,方便评审检查。未来真实产品阶段,我们会倾向于把 Memory Vault 放在用户本地或边缘可信设备中,平台侧只拿脱敏摘要和必要评分结果。也就是说,当前 Wave 2 先做到“本地原型不出域”,后续再升级到“边缘可信隔离”。
再次感谢这个问题,它帮助我们把“文档里的隐私声明”进一步落实到了代码可检查的接口里。