MedRoundTable Wave 3 半决赛 — 完整闭环智能体系统,整合14位AI专家+4大核心Skill+质量评估。一键运行,可验证的医学科研协作平台。
  • HTML 49.8%
  • Python 43.9%
  • JavaScript 4.8%
  • CSS 1.1%
  • Shell 0.4%
Find a file
MoKangMedical e675c42c87 交叉评测迭代: 回应Z2wen1tao_31评测反馈
📐 ARCHITECTURE.md (675行):
- 完整公开A2A编排核心逻辑, 10阶段讨论流程详解
- 14 Agent真实协作机制(非单LLM角色扮演)
- QualityAssessor 五维评分公式(28证据词+17辩论词)
- 用户打断机制+选择性上下文窗口
- Mermaid数据流图×3

📚 证据溯源增强:
- citation_manager.py: PMID/DOI/证据级别(I-IV)系统
- Demo输出自动附加「参考文献溯源」章节(4列表格)
- docs/EVIDENCE_TRACING.md (238行) 引文系统说明书

📊 评测基准+性能+合规:
- README: 参与率≥70%/综合评分≥0.6/证据引用≥0.5
- docs/PERFORMANCE.md: 串行vs并行/28s首轮/90s完整
- docs/COMPLIANCE.md: GDPR/个保法/免责声明

Fixes: #1
2026-05-15 21:23:43 +08:00
agents 交叉评测迭代: 回应Z2wen1tao_31评测反馈 2026-05-15 21:23:43 +08:00
backend 交叉评测迭代: 回应Z2wen1tao_31评测反馈 2026-05-15 21:23:43 +08:00
docs 交叉评测迭代: 回应Z2wen1tao_31评测反馈 2026-05-15 21:23:43 +08:00
frontend 前端全面深色金主题升级 — 对标康波研究院设计语言 2026-05-15 19:06:09 +08:00
skills Wave 3 半决赛提交 — 完整闭环智能体系统 2026-05-15 16:34:14 +08:00
skills_wave2 Wave 3 半决赛提交 — 完整闭环智能体系统 2026-05-15 16:34:14 +08:00
.gitignore Wave 3 半决赛提交 — 完整闭环智能体系统 2026-05-15 16:34:14 +08:00
config.env.example Wave 3 半决赛提交 — 完整闭环智能体系统 2026-05-15 16:34:14 +08:00
demo.sh Wave 3 半决赛提交 — 完整闭环智能体系统 2026-05-15 16:34:14 +08:00
docker-compose.yml Wave 3 半决赛提交 — 完整闭环智能体系统 2026-05-15 16:34:14 +08:00
ENV_SETUP.md Wave 3 半决赛提交 — 完整闭环智能体系统 2026-05-15 16:34:14 +08:00
medroundtable_agent.py Wave 3 半决赛提交 — 完整闭环智能体系统 2026-05-15 16:34:14 +08:00
README.md 交叉评测迭代: 回应Z2wen1tao_31评测反馈 2026-05-15 21:23:43 +08:00
README_W2_original.md Wave 3 半决赛提交 — 完整闭环智能体系统 2026-05-15 16:34:14 +08:00
requirements.txt Wave 3 半决赛提交 — 完整闭环智能体系统 2026-05-15 16:34:14 +08:00
start.sh Wave 3 半决赛提交 — 完整闭环智能体系统 2026-05-15 16:34:14 +08:00

MedRoundTable Wave 3 — 半决赛提交

SynNovator Wave 3 · 完整闭环智能体
14位AI专家 × 4大核心Skill × 自动路由 × 质量评估
🏥 临床试验设计 · 💊 药物重定位 · 🧬 罕见病诊断 · ✍️ 论文智能合著


🎯 项目概述

MedRoundTable 是一个基于 A2A (Agent-to-Agent) 多智能体架构的医学科研协作平台。

输入: 一个临床/科研问题
输出: 一份经14位专家协作讨论、质量评估后的可执行报告含JSON+Markdown

Wave 3 核心升级

维度 Wave 2 (S1W2) → Wave 3 (半决赛)
入口 4个独立脚本 1个统一Agent入口
路由 需手动选择 自动识别问题→路由Skill
闭环 单Skill运行 4Skills统一编排+评估
Demo 需逐个运行 demo.sh 一键4场景
输出 JSON JSON + Markdown + 质量报告
环境 requirements.txt 完整ENV_SETUP.md + Docker

🚀 30秒快速开始

# 1. 安装依赖
pip install -r requirements.txt

# 2. 配置 API Key
cp config.env.example config.env
# 编辑 config.env → 填入 DEEPSEEK_API_KEY

# 3. 运行
bash demo.sh

详细环境搭建 → ENV_SETUP.md


📊 系统架构

┌─────────────────────────────────────────────────────┐
│                  medroundtable_agent.py              │
│                     (统一入口)                        │
├──────────┬──────────┬──────────┬────────────────────┤
│   🏥     │   💊     │   🧬     │       ✍️           │
│ 临床试验 │ 药物重   │ 罕见病   │    论文智能         │
│  设计    │  定位    │  诊断    │      合著           │
├──────────┴──────────┴──────────┴────────────────────┤
│              A2A Orchestrator (14 Agents)            │
│  ┌─────────────────────────────────────────────────┐│
│  │ 核心团队: 临床主任 · 博士生 · 流行病学家         ││
│  │           · 统计学家 · 研究护士                   ││
│  │ 专项团队: 药物基因组 · GWAS · 单细胞 · Galaxy    ││
│  │          · AI工程师 · 趋势研究 · 实验追踪 · QA   ││
│  └─────────────────────────────────────────────────┘│
├─────────────────────────────────────────────────────┤
│              QualityAssessor (质量评估)              │
│        参与度 · 循证性 · 可执行性 · 综合评分          │
├─────────────────────────────────────────────────────┤
│                    输出层                             │
│        JSON报告 · Markdown报告 · Demo汇总            │
└─────────────────────────────────────────────────────┘

🔬 4大核心 Skill

🏥 Skill 1: 临床试验设计

场景: 从零设计一个完整的临床研究方案
输入: "设计一项评估CAR-T细胞治疗在晚期胃癌中的II期试验"
输出: 样本量计算、纳排标准、CRF字段、统计分析计划

💊 Skill 2: 药物重定位

场景: 为已知药物发现新适应症
输入: "探索二甲双胍在阿尔茨海默病中的重定位价值"
输出: 机制分析、靶点匹配、已有证据梳理、研究设计方案

🧬 Skill 3: 罕见病诊断

场景: 对未确诊罕见病患者进行系统性诊断推理
输入: "一名7岁儿童进行性肌无力原因不明"
输出: 鉴别诊断、推荐检测方案、文献证据、转诊建议

✍️ Skill 4: 论文智能合著

场景: 多专家协作完成一篇学术论文
输入: "基于已完成临床试验结果的论文撰写"
输出: 结构化稿件(引言/方法/结果/讨论)、图表建议、投稿建议


🎮 运行方式

# 交互模式
python medroundtable_agent.py

# Demo一键4场景
python medroundtable_agent.py --demo

# 指定场景
python medroundtable_agent.py --scene trial
python medroundtable_agent.py --scene drug
python medroundtable_agent.py --scene rare
python medroundtable_agent.py --scene paper

# 自动路由
python medroundtable_agent.py --question "评估SGLT2抑制剂在心力衰竭中的疗效"

# Web API
bash start.sh
# → http://localhost:8000/docs

可验证的用户价值

闭环验证流程

用户输入临床问题
    ↓
智能路由 → 识别问题类型 → 匹配最优Skill
    ↓
14位专家A2A协作讨论8个讨论阶段
    ↓
QualityAssessor 自动评估4维度评分
    ↓
可执行交付物输出(样本量/CRF/方案/报告)
    ↓
用户可基于输出直接推进研究

质量指标

指标 目标 说明
Agent参与率 ≥ 70% 14位Agent中≥10位参与讨论
综合质量评分 ≥ 0.6 QualityAssessor 自动评分
输出可执行性 含具体数字 样本量/剂量/时间窗等
运行完成率 100% 4场景全部通过

📁 仓库结构

Medroundtable-W3/
├── medroundtable_agent.py    # 🆕 统一智能体入口Wave 3 核心)
├── demo.sh                    # 🆕 一键演示脚本
├── config.env.example         # 🆕 配置模板
├── ENV_SETUP.md               # 🆕 环境搭建指南
├── agents/                    # Agent系统
│   ├── orchestrator.py        #    A2A编排器1516行
│   ├── llm_client.py          #    LLM客户端
│   ├── prompts.py             #    14Agent配置
│   └── quality_assessor.py    #    质量评估器
├── skills_wave2/              # 4大核心Skill
│   ├── skill_clinical_trial_design.py
│   ├── skill_drug_repurposing.py
│   ├── skill_rare_disease_diagnosis.py
│   └── skill_paper_coauthoring.py
├── backend/                   # FastAPI后端
│   └── citation_manager.py    # 🆕 PMID/DOI引文溯源 + 证据级别系统
├── frontend/                  # 19页Web前端
├── docs/                      # 📚 文档
│   └── EVIDENCE_TRACING.md    # 🆕 医学证据溯源说明
├── output/                    # 运行输出
└── requirements.txt           # Python依赖

🛠 技术栈

  • 语言: Python 3.10+
  • 框架: FastAPI + asyncio
  • AI: DeepSeek V4 Pro / Moonshot Kimi (OpenAI兼容API)
  • 前端: HTML5/JS (19页)
  • 部署: Docker Compose / Shell

🔬 医学证据溯源 — 减少LLM幻觉

MedRoundTable-W3 内建了完整的医学文献溯源系统确保每条AI生成的医学论断都有据可查。

证据级别系统

所有引用文献均按循证医学(EBM)金字塔分级:

级别 证据类型 示例
Level I RCT / Meta-analysis / Systematic Review UKPDS 1998, 大规模多中心RCT
Level II Cohort study / Controlled trial 大样本前瞻性队列研究
Level III Case-control / Case series 回顾性病例对照研究
Level IV Expert opinion / Guideline / Textbook ADA指南, CONSORT声明

PMID/DOI 溯源标记

每份Demo输出的参考文献均包含

  • [PMID:9742976] — 点击直链到 PubMed 原文
  • [DOI:10.1016/S0140-6736(98)07019-6] — DOI永久链接
  • 证据级别徽章 — 一目了然的证据强度

如何降低幻觉?

AI生成医学结论
    ↓
citation_manager 关键词匹配 → 查找PubMed文献数据库
    ↓
为每个结论附加 PMID/DOI 证据标记
    ↓
generate_evidence_tracing_section() 生成溯源表格
    ↓
用户可一键点击验证每项声明的原始文献

📖 详细说明: docs/EVIDENCE_TRACING.md


📞 联系方式


📊 评测基准

以下评测指标为 MedRoundtable-W3 系统的性能与质量基准适用于所有4大Skill场景。

参与度指标

指标 基准值 说明
首轮 Agent 参与率 100%14/14 首轮讨论所有14位Agent必须全部参与发言
每阶段最低参与率 ≥70% 每个讨论Stage至少10位Agent参与含核心团队全员
Rebuttal 交叉质询数 ≥3条 Rebuttal阶段必须产生≥3条跨Agent交叉质询

质量指标

指标 基准值 说明
综合评分 ≥0.6 由 QualityAssessor 自动计算(参与度 + 循证性 + 可执行性 + 逻辑性加权)
证据引用率 ≥0.5 每300字输出至少包含1条文献/数据引用
输出完整度 三项齐全 所有输出必须包含 JSON 报告 + Markdown 报告 + Quality Report

评测方法

运行评估流程
    ↓
检查: 首轮是否14/14 Agent参与
    ↓
检查: 每个Stage参与 Agent ≥ 10
    ↓
检查: Rebuttal阶段交叉质询数 ≥ 3
    ↓
检查: 证据引用密度 ≥ 0.5条/300字
    ↓
检查: JSON + Markdown + Quality Report 三项输出完整?
    ↓
QualityAssessor 综合评分 ≥ 0.6 → 通过 ✅

Wave 3 赛段: 半决赛 提交时间: 2026年5月 | 报名: 5月14-16日 | 开发: 5月17-23日