smartresearch2026/Medroundtable-W3

MedRoundTable Wave 3 半决赛 — 完整闭环智能体系统，整合14位AI专家+4大核心Skill+质量评估。一键运行，可验证的医学科研协作平台。

HTML 49.8%
Python 43.9%
JavaScript 4.8%
CSS 1.1%
Shell 0.4%

Find a file

MoKangMedical e675c42c87 交叉评测迭代: 回应Z2wen1tao_31评测反馈 📐 ARCHITECTURE.md (675行): - 完整公开A2A编排核心逻辑, 10阶段讨论流程详解 - 14 Agent真实协作机制(非单LLM角色扮演) - QualityAssessor 五维评分公式(28证据词+17辩论词) - 用户打断机制+选择性上下文窗口 - Mermaid数据流图×3 📚 证据溯源增强: - citation_manager.py: PMID/DOI/证据级别(I-IV)系统 - Demo输出自动附加「参考文献溯源」章节(4列表格) - docs/EVIDENCE_TRACING.md (238行) 引文系统说明书 📊 评测基准+性能+合规: - README: 参与率≥70%/综合评分≥0.6/证据引用≥0.5 - docs/PERFORMANCE.md: 串行vs并行/28s首轮/90s完整 - docs/COMPLIANCE.md: GDPR/个保法/免责声明 Fixes: #1		2026-05-15 21:23:43 +08:00
agents	交叉评测迭代: 回应Z2wen1tao_31评测反馈	2026-05-15 21:23:43 +08:00
backend	交叉评测迭代: 回应Z2wen1tao_31评测反馈	2026-05-15 21:23:43 +08:00
docs	交叉评测迭代: 回应Z2wen1tao_31评测反馈	2026-05-15 21:23:43 +08:00
frontend	前端全面深色金主题升级 — 对标康波研究院设计语言	2026-05-15 19:06:09 +08:00
skills	Wave 3 半决赛提交 — 完整闭环智能体系统	2026-05-15 16:34:14 +08:00
skills_wave2	Wave 3 半决赛提交 — 完整闭环智能体系统	2026-05-15 16:34:14 +08:00
.gitignore	Wave 3 半决赛提交 — 完整闭环智能体系统	2026-05-15 16:34:14 +08:00
config.env.example	Wave 3 半决赛提交 — 完整闭环智能体系统	2026-05-15 16:34:14 +08:00
demo.sh	Wave 3 半决赛提交 — 完整闭环智能体系统	2026-05-15 16:34:14 +08:00
docker-compose.yml	Wave 3 半决赛提交 — 完整闭环智能体系统	2026-05-15 16:34:14 +08:00
ENV_SETUP.md	Wave 3 半决赛提交 — 完整闭环智能体系统	2026-05-15 16:34:14 +08:00
medroundtable_agent.py	Wave 3 半决赛提交 — 完整闭环智能体系统	2026-05-15 16:34:14 +08:00
README.md	交叉评测迭代: 回应Z2wen1tao_31评测反馈	2026-05-15 21:23:43 +08:00
README_W2_original.md	Wave 3 半决赛提交 — 完整闭环智能体系统	2026-05-15 16:34:14 +08:00
requirements.txt	Wave 3 半决赛提交 — 完整闭环智能体系统	2026-05-15 16:34:14 +08:00
start.sh	Wave 3 半决赛提交 — 完整闭环智能体系统	2026-05-15 16:34:14 +08:00

README.md

MedRoundTable Wave 3 — 半决赛提交

SynNovator Wave 3 · 完整闭环智能体
14位AI专家 × 4大核心Skill × 自动路由 × 质量评估
🏥 临床试验设计 · 💊 药物重定位 · 🧬 罕见病诊断 · ✍️ 论文智能合著

🎯 项目概述

MedRoundTable 是一个基于 A2A (Agent-to-Agent) 多智能体架构的医学科研协作平台。

输入: 一个临床/科研问题
输出: 一份经14位专家协作讨论、质量评估后的可执行报告（含JSON+Markdown）

Wave 3 核心升级

维度	Wave 2 (S1W2)	→ Wave 3 (半决赛)
入口	4个独立脚本	1个统一Agent入口
路由	需手动选择	自动识别问题→路由Skill
闭环	单Skill运行	4Skills统一编排+评估
Demo	需逐个运行	`demo.sh` 一键4场景
输出	JSON	JSON + Markdown + 质量报告
环境	requirements.txt	完整ENV_SETUP.md + Docker

🚀 30秒快速开始

# 1. 安装依赖
pip install -r requirements.txt

# 2. 配置 API Key
cp config.env.example config.env
# 编辑 config.env → 填入 DEEPSEEK_API_KEY

# 3. 运行
bash demo.sh

详细环境搭建 → ENV_SETUP.md

📊 系统架构

┌─────────────────────────────────────────────────────┐
│                  medroundtable_agent.py              │
│                     (统一入口)                        │
├──────────┬──────────┬──────────┬────────────────────┤
│   🏥     │   💊     │   🧬     │       ✍️           │
│ 临床试验 │ 药物重   │ 罕见病   │    论文智能         │
│  设计    │  定位    │  诊断    │      合著           │
├──────────┴──────────┴──────────┴────────────────────┤
│              A2A Orchestrator (14 Agents)            │
│  ┌─────────────────────────────────────────────────┐│
│  │ 核心团队: 临床主任 · 博士生 · 流行病学家         ││
│  │           · 统计学家 · 研究护士                   ││
│  │ 专项团队: 药物基因组 · GWAS · 单细胞 · Galaxy    ││
│  │          · AI工程师 · 趋势研究 · 实验追踪 · QA   ││
│  └─────────────────────────────────────────────────┘│
├─────────────────────────────────────────────────────┤
│              QualityAssessor (质量评估)              │
│        参与度 · 循证性 · 可执行性 · 综合评分          │
├─────────────────────────────────────────────────────┤
│                    输出层                             │
│        JSON报告 · Markdown报告 · Demo汇总            │
└─────────────────────────────────────────────────────┘

🔬 4大核心 Skill

🏥 Skill 1: 临床试验设计

场景: 从零设计一个完整的临床研究方案
输入: "设计一项评估CAR-T细胞治疗在晚期胃癌中的II期试验"
输出: 样本量计算、纳排标准、CRF字段、统计分析计划

💊 Skill 2: 药物重定位

场景: 为已知药物发现新适应症
输入: "探索二甲双胍在阿尔茨海默病中的重定位价值"
输出: 机制分析、靶点匹配、已有证据梳理、研究设计方案

🧬 Skill 3: 罕见病诊断

场景: 对未确诊罕见病患者进行系统性诊断推理
输入: "一名7岁儿童，进行性肌无力，原因不明"
输出: 鉴别诊断、推荐检测方案、文献证据、转诊建议

✍️ Skill 4: 论文智能合著

场景: 多专家协作完成一篇学术论文
输入: "基于已完成临床试验结果的论文撰写"
输出: 结构化稿件（引言/方法/结果/讨论）、图表建议、投稿建议

🎮 运行方式

# 交互模式
python medroundtable_agent.py

# Demo（一键4场景）
python medroundtable_agent.py --demo

# 指定场景
python medroundtable_agent.py --scene trial
python medroundtable_agent.py --scene drug
python medroundtable_agent.py --scene rare
python medroundtable_agent.py --scene paper

# 自动路由
python medroundtable_agent.py --question "评估SGLT2抑制剂在心力衰竭中的疗效"

# Web API
bash start.sh
# → http://localhost:8000/docs

✅ 可验证的用户价值

闭环验证流程

用户输入临床问题
    ↓
智能路由 → 识别问题类型 → 匹配最优Skill
    ↓
14位专家A2A协作讨论（8个讨论阶段）
    ↓
QualityAssessor 自动评估（4维度评分）
    ↓
可执行交付物输出（样本量/CRF/方案/报告）
    ↓
用户可基于输出直接推进研究

质量指标

指标	目标	说明
Agent参与率	≥ 70%	14位Agent中≥10位参与讨论
综合质量评分	≥ 0.6	QualityAssessor 自动评分
输出可执行性	含具体数字	样本量/剂量/时间窗等
运行完成率	100%	4场景全部通过

📁 仓库结构

Medroundtable-W3/
├── medroundtable_agent.py    # 🆕 统一智能体入口（Wave 3 核心）
├── demo.sh                    # 🆕 一键演示脚本
├── config.env.example         # 🆕 配置模板
├── ENV_SETUP.md               # 🆕 环境搭建指南
├── agents/                    # Agent系统
│   ├── orchestrator.py        #    A2A编排器（1516行）
│   ├── llm_client.py          #    LLM客户端
│   ├── prompts.py             #    14Agent配置
│   └── quality_assessor.py    #    质量评估器
├── skills_wave2/              # 4大核心Skill
│   ├── skill_clinical_trial_design.py
│   ├── skill_drug_repurposing.py
│   ├── skill_rare_disease_diagnosis.py
│   └── skill_paper_coauthoring.py
├── backend/                   # FastAPI后端
│   └── citation_manager.py    # 🆕 PMID/DOI引文溯源 + 证据级别系统
├── frontend/                  # 19页Web前端
├── docs/                      # 📚 文档
│   └── EVIDENCE_TRACING.md    # 🆕 医学证据溯源说明
├── output/                    # 运行输出
└── requirements.txt           # Python依赖

🛠 技术栈

语言: Python 3.10+
框架: FastAPI + asyncio
AI: DeepSeek V4 Pro / Moonshot Kimi (OpenAI兼容API)
前端: HTML5/JS (19页)
部署: Docker Compose / Shell

🔬 医学证据溯源 — 减少LLM幻觉

MedRoundTable-W3 内建了完整的医学文献溯源系统，确保每条AI生成的医学论断都有据可查。

证据级别系统

所有引用文献均按循证医学(EBM)金字塔分级：

级别	证据类型	示例
Level I	RCT / Meta-analysis / Systematic Review	UKPDS 1998, 大规模多中心RCT
Level II	Cohort study / Controlled trial	大样本前瞻性队列研究
Level III	Case-control / Case series	回顾性病例对照研究
Level IV	Expert opinion / Guideline / Textbook	ADA指南, CONSORT声明

PMID/DOI 溯源标记

每份Demo输出的参考文献均包含：

[PMID:9742976] — 点击直链到 PubMed 原文
[DOI:10.1016/S0140-6736(98)07019-6] — DOI永久链接
证据级别徽章 — 一目了然的证据强度

如何降低幻觉？

AI生成医学结论
    ↓
citation_manager 关键词匹配 → 查找PubMed文献数据库
    ↓
为每个结论附加 PMID/DOI 证据标记
    ↓
generate_evidence_tracing_section() 生成溯源表格
    ↓
用户可一键点击验证每项声明的原始文献

📖 详细说明: docs/EVIDENCE_TRACING.md

📞 联系方式

SynNovator 仓库: https://www.synnovator.com/smartresearch2026/Medroundtable-W3
问题反馈: 请在本仓库提交 Issue

📊 评测基准

以下评测指标为 MedRoundtable-W3 系统的性能与质量基准，适用于所有4大Skill场景。

参与度指标

指标	基准值	说明
首轮 Agent 参与率	100%（14/14）	首轮讨论所有14位Agent必须全部参与发言
每阶段最低参与率	≥70%	每个讨论Stage至少10位Agent参与（含核心团队全员）
Rebuttal 交叉质询数	≥3条	Rebuttal阶段必须产生≥3条跨Agent交叉质询

质量指标

指标	基准值	说明
综合评分	≥0.6	由 QualityAssessor 自动计算（参与度 + 循证性 + 可执行性 + 逻辑性加权）
证据引用率	≥0.5	每300字输出至少包含1条文献/数据引用
输出完整度	三项齐全	所有输出必须包含 JSON 报告 + Markdown 报告 + Quality Report

评测方法

运行评估流程
    ↓
检查: 首轮是否14/14 Agent参与？
    ↓
检查: 每个Stage参与 Agent ≥ 10？
    ↓
检查: Rebuttal阶段交叉质询数 ≥ 3？
    ↓
检查: 证据引用密度 ≥ 0.5条/300字？
    ↓
检查: JSON + Markdown + Quality Report 三项输出完整？
    ↓
QualityAssessor 综合评分 ≥ 0.6 → 通过 ✅

Wave 3 赛段: 半决赛 提交时间: 2026年5月 | 报名: 5月14-16日 | 开发: 5月17-23日

README.md Unescape Escape

MedRoundTable Wave 3 — 半决赛提交

🎯 项目概述

Wave 3 核心升级

🚀 30秒快速开始

📊 系统架构

🔬 4大核心 Skill

🏥 Skill 1: 临床试验设计

💊 Skill 2: 药物重定位

🧬 Skill 3: 罕见病诊断

✍️ Skill 4: 论文智能合著

🎮 运行方式

✅ 可验证的用户价值

闭环验证流程

质量指标

📁 仓库结构

🛠 技术栈

🔬 医学证据溯源 — 减少LLM幻觉

证据级别系统

PMID/DOI 溯源标记

如何降低幻觉？

📞 联系方式

📊 评测基准

参与度指标

质量指标

评测方法

README.md