- HTML 49.8%
- Python 43.9%
- JavaScript 4.8%
- CSS 1.1%
- Shell 0.4%
📐 ARCHITECTURE.md (675行): - 完整公开A2A编排核心逻辑, 10阶段讨论流程详解 - 14 Agent真实协作机制(非单LLM角色扮演) - QualityAssessor 五维评分公式(28证据词+17辩论词) - 用户打断机制+选择性上下文窗口 - Mermaid数据流图×3 📚 证据溯源增强: - citation_manager.py: PMID/DOI/证据级别(I-IV)系统 - Demo输出自动附加「参考文献溯源」章节(4列表格) - docs/EVIDENCE_TRACING.md (238行) 引文系统说明书 📊 评测基准+性能+合规: - README: 参与率≥70%/综合评分≥0.6/证据引用≥0.5 - docs/PERFORMANCE.md: 串行vs并行/28s首轮/90s完整 - docs/COMPLIANCE.md: GDPR/个保法/免责声明 Fixes: #1 |
||
|---|---|---|
| agents | ||
| backend | ||
| docs | ||
| frontend | ||
| skills | ||
| skills_wave2 | ||
| .gitignore | ||
| config.env.example | ||
| demo.sh | ||
| docker-compose.yml | ||
| ENV_SETUP.md | ||
| medroundtable_agent.py | ||
| README.md | ||
| README_W2_original.md | ||
| requirements.txt | ||
| start.sh | ||
MedRoundTable Wave 3 — 半决赛提交
SynNovator Wave 3 · 完整闭环智能体
14位AI专家 × 4大核心Skill × 自动路由 × 质量评估
🏥 临床试验设计 · 💊 药物重定位 · 🧬 罕见病诊断 · ✍️ 论文智能合著
🎯 项目概述
MedRoundTable 是一个基于 A2A (Agent-to-Agent) 多智能体架构的医学科研协作平台。
输入: 一个临床/科研问题
输出: 一份经14位专家协作讨论、质量评估后的可执行报告(含JSON+Markdown)
Wave 3 核心升级
| 维度 | Wave 2 (S1W2) | → Wave 3 (半决赛) |
|---|---|---|
| 入口 | 4个独立脚本 | 1个统一Agent入口 |
| 路由 | 需手动选择 | 自动识别问题→路由Skill |
| 闭环 | 单Skill运行 | 4Skills统一编排+评估 |
| Demo | 需逐个运行 | demo.sh 一键4场景 |
| 输出 | JSON | JSON + Markdown + 质量报告 |
| 环境 | requirements.txt | 完整ENV_SETUP.md + Docker |
🚀 30秒快速开始
# 1. 安装依赖
pip install -r requirements.txt
# 2. 配置 API Key
cp config.env.example config.env
# 编辑 config.env → 填入 DEEPSEEK_API_KEY
# 3. 运行
bash demo.sh
详细环境搭建 → ENV_SETUP.md
📊 系统架构
┌─────────────────────────────────────────────────────┐
│ medroundtable_agent.py │
│ (统一入口) │
├──────────┬──────────┬──────────┬────────────────────┤
│ 🏥 │ 💊 │ 🧬 │ ✍️ │
│ 临床试验 │ 药物重 │ 罕见病 │ 论文智能 │
│ 设计 │ 定位 │ 诊断 │ 合著 │
├──────────┴──────────┴──────────┴────────────────────┤
│ A2A Orchestrator (14 Agents) │
│ ┌─────────────────────────────────────────────────┐│
│ │ 核心团队: 临床主任 · 博士生 · 流行病学家 ││
│ │ · 统计学家 · 研究护士 ││
│ │ 专项团队: 药物基因组 · GWAS · 单细胞 · Galaxy ││
│ │ · AI工程师 · 趋势研究 · 实验追踪 · QA ││
│ └─────────────────────────────────────────────────┘│
├─────────────────────────────────────────────────────┤
│ QualityAssessor (质量评估) │
│ 参与度 · 循证性 · 可执行性 · 综合评分 │
├─────────────────────────────────────────────────────┤
│ 输出层 │
│ JSON报告 · Markdown报告 · Demo汇总 │
└─────────────────────────────────────────────────────┘
🔬 4大核心 Skill
🏥 Skill 1: 临床试验设计
场景: 从零设计一个完整的临床研究方案
输入: "设计一项评估CAR-T细胞治疗在晚期胃癌中的II期试验"
输出: 样本量计算、纳排标准、CRF字段、统计分析计划
💊 Skill 2: 药物重定位
场景: 为已知药物发现新适应症
输入: "探索二甲双胍在阿尔茨海默病中的重定位价值"
输出: 机制分析、靶点匹配、已有证据梳理、研究设计方案
🧬 Skill 3: 罕见病诊断
场景: 对未确诊罕见病患者进行系统性诊断推理
输入: "一名7岁儿童,进行性肌无力,原因不明"
输出: 鉴别诊断、推荐检测方案、文献证据、转诊建议
✍️ Skill 4: 论文智能合著
场景: 多专家协作完成一篇学术论文
输入: "基于已完成临床试验结果的论文撰写"
输出: 结构化稿件(引言/方法/结果/讨论)、图表建议、投稿建议
🎮 运行方式
# 交互模式
python medroundtable_agent.py
# Demo(一键4场景)
python medroundtable_agent.py --demo
# 指定场景
python medroundtable_agent.py --scene trial
python medroundtable_agent.py --scene drug
python medroundtable_agent.py --scene rare
python medroundtable_agent.py --scene paper
# 自动路由
python medroundtable_agent.py --question "评估SGLT2抑制剂在心力衰竭中的疗效"
# Web API
bash start.sh
# → http://localhost:8000/docs
✅ 可验证的用户价值
闭环验证流程
用户输入临床问题
↓
智能路由 → 识别问题类型 → 匹配最优Skill
↓
14位专家A2A协作讨论(8个讨论阶段)
↓
QualityAssessor 自动评估(4维度评分)
↓
可执行交付物输出(样本量/CRF/方案/报告)
↓
用户可基于输出直接推进研究
质量指标
| 指标 | 目标 | 说明 |
|---|---|---|
| Agent参与率 | ≥ 70% | 14位Agent中≥10位参与讨论 |
| 综合质量评分 | ≥ 0.6 | QualityAssessor 自动评分 |
| 输出可执行性 | 含具体数字 | 样本量/剂量/时间窗等 |
| 运行完成率 | 100% | 4场景全部通过 |
📁 仓库结构
Medroundtable-W3/
├── medroundtable_agent.py # 🆕 统一智能体入口(Wave 3 核心)
├── demo.sh # 🆕 一键演示脚本
├── config.env.example # 🆕 配置模板
├── ENV_SETUP.md # 🆕 环境搭建指南
├── agents/ # Agent系统
│ ├── orchestrator.py # A2A编排器(1516行)
│ ├── llm_client.py # LLM客户端
│ ├── prompts.py # 14Agent配置
│ └── quality_assessor.py # 质量评估器
├── skills_wave2/ # 4大核心Skill
│ ├── skill_clinical_trial_design.py
│ ├── skill_drug_repurposing.py
│ ├── skill_rare_disease_diagnosis.py
│ └── skill_paper_coauthoring.py
├── backend/ # FastAPI后端
│ └── citation_manager.py # 🆕 PMID/DOI引文溯源 + 证据级别系统
├── frontend/ # 19页Web前端
├── docs/ # 📚 文档
│ └── EVIDENCE_TRACING.md # 🆕 医学证据溯源说明
├── output/ # 运行输出
└── requirements.txt # Python依赖
🛠 技术栈
- 语言: Python 3.10+
- 框架: FastAPI + asyncio
- AI: DeepSeek V4 Pro / Moonshot Kimi (OpenAI兼容API)
- 前端: HTML5/JS (19页)
- 部署: Docker Compose / Shell
🔬 医学证据溯源 — 减少LLM幻觉
MedRoundTable-W3 内建了完整的医学文献溯源系统,确保每条AI生成的医学论断都有据可查。
证据级别系统
所有引用文献均按循证医学(EBM)金字塔分级:
| 级别 | 证据类型 | 示例 |
|---|---|---|
| Level I | RCT / Meta-analysis / Systematic Review | UKPDS 1998, 大规模多中心RCT |
| Level II | Cohort study / Controlled trial | 大样本前瞻性队列研究 |
| Level III | Case-control / Case series | 回顾性病例对照研究 |
| Level IV | Expert opinion / Guideline / Textbook | ADA指南, CONSORT声明 |
PMID/DOI 溯源标记
每份Demo输出的参考文献均包含:
- [PMID:9742976] — 点击直链到 PubMed 原文
- [DOI:10.1016/S0140-6736(98)07019-6] — DOI永久链接
- 证据级别徽章 — 一目了然的证据强度
如何降低幻觉?
AI生成医学结论
↓
citation_manager 关键词匹配 → 查找PubMed文献数据库
↓
为每个结论附加 PMID/DOI 证据标记
↓
generate_evidence_tracing_section() 生成溯源表格
↓
用户可一键点击验证每项声明的原始文献
📖 详细说明: docs/EVIDENCE_TRACING.md
📞 联系方式
- SynNovator 仓库: https://www.synnovator.com/smartresearch2026/Medroundtable-W3
- 问题反馈: 请在本仓库提交 Issue
📊 评测基准
以下评测指标为 MedRoundtable-W3 系统的性能与质量基准,适用于所有4大Skill场景。
参与度指标
| 指标 | 基准值 | 说明 |
|---|---|---|
| 首轮 Agent 参与率 | 100%(14/14) | 首轮讨论所有14位Agent必须全部参与发言 |
| 每阶段最低参与率 | ≥70% | 每个讨论Stage至少10位Agent参与(含核心团队全员) |
| Rebuttal 交叉质询数 | ≥3条 | Rebuttal阶段必须产生≥3条跨Agent交叉质询 |
质量指标
| 指标 | 基准值 | 说明 |
|---|---|---|
| 综合评分 | ≥0.6 | 由 QualityAssessor 自动计算(参与度 + 循证性 + 可执行性 + 逻辑性加权) |
| 证据引用率 | ≥0.5 | 每300字输出至少包含1条文献/数据引用 |
| 输出完整度 | 三项齐全 | 所有输出必须包含 JSON 报告 + Markdown 报告 + Quality Report |
评测方法
运行评估流程
↓
检查: 首轮是否14/14 Agent参与?
↓
检查: 每个Stage参与 Agent ≥ 10?
↓
检查: Rebuttal阶段交叉质询数 ≥ 3?
↓
检查: 证据引用密度 ≥ 0.5条/300字?
↓
检查: JSON + Markdown + Quality Report 三项输出完整?
↓
QualityAssessor 综合评分 ≥ 0.6 → 通过 ✅
Wave 3 赛段: 半决赛 提交时间: 2026年5月 | 报名: 5月14-16日 | 开发: 5月17-23日