生物医药战略情报系统
- Shell 100%
| .forgejo/workflows | ||
| pharma-intelligence-system | ||
| CONTRIBUTING.md | ||
| README.md | ||
| submissions.json | ||
| SUBMISSIONS.md | ||
track-28
项目提案 (Specs) — Wave 1
滴水湖全球OPC人工智能挑战赛
数智OPC加速赛 · 数字产业赛道(AI+医疗)
一、项目基本信息
| 项目 | 内容 |
|---|---|
| 项目名称 | Pharma Intelligence System(生物医药战略情报系统) |
| 参赛赛道 | 数字产业赛道(AI+医疗) |
| 所属赛区 | 数智场景赛区 |
| OPC定位 | AI驱动的单人生物医药情报与分析公司 |
| 项目标语 | 一人公司,全栈情报——让AI为生物医药战略决策赋能 |
二、项目概述
Pharma Intelligence System 是一个以 "一人公司 (OPC) + AI多智能体协同" 为核心模式的生物医药战略情报系统。系统通过自动化采集全球9大公开数据源(PubMed、ClinicalTrials.gov、openFDA、EMA、bioRxiv/medRxiv等),运用AI大模型进行深度情报分析、竞争格局推演和前瞻性预测,最终生成专业级战略决策报告。
系统完美实现了 "人类主导战略方向,AI负责数据采集、分析、报告生成全流程" 的 OPC 核心理念——一个创始人即可运营一家覆盖全球生物医药情报的全栈AI公司。
三、应用场景
场景一:生物医药企业研发战略决策
- 痛点:生物医药企业CEO/CSO需要持续监控全球竞争格局、FDA监管动态、最新科研突破,但传统情报服务(如Evaluate Pharma、IQVIA)年费高达数十万美元,且更新周期长。
- 解决方案:系统每日自动采集9大公开数据源,24小时内生成定制化竞争分析报告,成本仅为传统方案的1%。
- 用户价值:每年节省情报采购费用50万+,决策响应速度从周级提升至小时级。
场景二:生物医药投资尽职调查
- 痛点:投资人在评估生物医药项目时,需要综合分析目标公司的管线竞争力、靶点热度、监管风险、学术背书等多个维度,传统尽调耗时2-4周。
- 解决方案:一键生成目标公司/靶点的全景分析报告,涵盖临床试验管线、FDA安全性记录、学术前沿热度。
- 用户价值:尽调周期从2-4周缩短至1天,覆盖信息维度提升300%。
场景三:科研机构前沿追踪
- 痛点:科研人员需要从海量文献中识别新技术趋势和潜在合作机会,个人难以覆盖所有顶刊。
- 解决方案:系统自动追踪58种高影响力期刊,通过关键词聚类和跨源验证识别新兴技术信号(如PROTAC、分子胶、ADC新一代技术)。
- 用户价值:科研方向决策有数据支撑,早期识别技术转折点。
场景四:监管合规早期预警
- 痛点:FDA药品召回和不良事件信息分散,企业难以及时获取与自己管线相关的安全性信号。
- 解决方案:系统实时监控FDA召回、不良事件数据,与企业自身管线进行交叉比对,触发早期预警。
- 用户价值:安全性风险管理从被动响应升级为主动预警。
四、产品需求 (Product Requirements)
4.1 功能需求
| 编号 | 功能模块 | 优先级 | 描述 |
|---|---|---|---|
| FR-01 | 多源数据自动采集 | P0 | 从9+个公开数据源自动采集结构化/非结构化情报数据 |
| FR-02 | 药物实体归一化 | P0 | 500+药物同义词库,自动识别同一药物的不同命名(商品名/通用名/代号) |
| FR-03 | 知识图谱构建 | P0 | Neo4j图数据库,存储药物-靶点-疾病-企业的多维关联网络 |
| FR-04 | 靶点竞争格局分析 | P0 | 自动分析各靶点的在研药物数量、竞争等级(红海/蓝海) |
| FR-05 | FDA监管信号分析 | P0 | 药品召回分类统计、不良事件趋势、审批动态追踪 |
| FR-06 | 临床试验管线聚合 | P0 | 按企业/靶点/适应症聚合全球临床试验数据 |
| FR-07 | 学术前沿信号识别 | P0 | 从58种顶刊论文中识别新兴技术趋势 |
| FR-08 | 前瞻性预测生成 | P0 | 基于多源数据交叉验证的行业趋势预测(含置信度评分) |
| FR-09 | 专业级报告生成 | P0 | 自动生成图文并茂的HTML战略报告,含Plotly交互图表 |
| FR-10 | 交互式知识图谱浏览 | P1 | D3.js力导向图可视化,支持搜索/点击/关联探索 |
4.2 非功能需求
| 编号 | 需求 | 指标 |
|---|---|---|
| NFR-01 | 数据时效性 | PubMed/ClinicalTrials数据采集周期 < 24小时 |
| NFR-02 | 数据质量 | 无模拟/伪造数据,所有数据源可追溯至原始API |
| NFR-03 | API合规 | 尊重各数据源API速率限制(PubMed 10req/sec, openFDA等) |
| NFR-04 | 报告完整度 | 每次运行生成3,000+条分析文档,7章节深度分析报告 |
| NFR-05 | 运行效率 | 完整流水线(采集→分析→报告)< 30分钟 |
4.3 技术栈
| 层次 | 技术选型 | 说明 |
|---|---|---|
| 数据采集 | Python + NCBI E-utilities + openFDA + ClinicalTrials.gov v2 | 异步/同步HTTP请求 |
| 数据存储 | SQLite + Neo4j(图数据库) | 关系数据 + 知识图谱 |
| 实体归一化 | 500+药物同义词库 + 模式匹配 | 自定义引擎,非LLM依赖 |
| 知识图谱查询 | Cypher (9大分析查询API) | 竞争格局/关联网络/热点分析 |
| 报告生成 | Python + string.Template + Plotly.js | 纯HTML,无外部依赖 |
| 知识库 | Obsidian Markdown(91+笔记) | 可导入Obsidian浏览 |
| 可视化 | D3.js + Plotly | 交互式图谱 + 统计图表 |
五、OPC模式实现
5.1 人类与AI分工
| 角色 | 人类(创业者) | AI(系统) |
|---|---|---|
| 战略方向 | ✅ 设定分析主题、靶点优先级 | — |
| 数据采集 | — | ✅ 自动采集9大源,尊重API限制 |
| 数据处理 | — | ✅ 清洗、归一化、去重 |
| 知识建模 | — | ✅ Neo4j图谱构建 |
| 竞争分析 | — | ✅ 靶点矩阵、红海/蓝海识别 |
| 监管信号 | — | ✅ FDA召回/不良事件/审批趋势 |
| 趋势预测 | — | ✅ 多源交叉验证的置信度评分 |
| 报告生成 | — | ✅ 7章节专业报告 + 4交互图表 |
| 决策判断 | ✅ 最终决策和战略选择 | ✅ 提供数据支撑的分析建议 |
5.2 OPC杠杆效应
- 人力杠杆:1人(创业者)运营,AI替代传统情报团队8-12人(数据工程师×2、分析师×3、报告撰写×2、领域专家×1-2、QA×1)
- 成本杠杆:运营成本仅为年度云的算力成本,无人工薪资支出
- 时间杠杆:日级报告更新 vs 传统周级/月级更新
- 覆盖杠杆:同时监控9个数据源 vs 传统人工2-3个源
六、评测标准 (Evaluation Criteria)
6.1 AI评审维度
| 维度 | 权重 | 评测标准 | 自评得分依据 |
|---|---|---|---|
| 创新性与技术含量 | 30% | 核心技术:AI多智能体协同模式、500+药物同义词库、跨源交叉验证 | 自研归一化引擎、Neo4j知识图谱、跨源三重验证 |
| AI+OPC模式可行性 | 30% | 单人+AI高效协同,人力/AI分工合理 | 1人运维,AI覆盖全流程数据采集→分析→报告 |
| 市场潜力与社会价值 | 30% | 市场规模、成长性、社会经济效益 | 全球药企情报市场$50亿+,替代传统高成本方案 |
| 落地临港可行性 | 10% | 与临港产业政策契合度 | 数据跨境、AI基础设施、生物医药三大政策方向吻合 |
6.2 技术评测指标
| 评测项 | 通过标准 | 当前状态 |
|---|---|---|
| 数据源覆盖数 | ≥5个 | ✅ 9个(PubMed, ClinicalTrials, openFDA, EMA, bioRxiv/medRxiv, arXiv, News) |
| 文档采集量 | ≥1,000条 | ✅ 5,317条 |
| 知识图谱节点 | ≥1,000 | ✅ 大型知识图谱(Neo4j) |
| 报告生成 | 自动生成,图文并茂 | ✅ 48KB HTML报告,4个Plotly图表 |
| 药物实体归一化 | 支持同义词映射 | ✅ 500+药物,多策略归一化 |
| 无伪造数据 | 所有数据可追溯 | ✅ 已验证无模拟数据 |
七、项目里程碑
| 阶段 | 完成状态 | 交付物 |
|---|---|---|
| Wave 1 - Specs | ✅ 已完成 | 本项目提案 |
| Wave 2 - Skills/Prototype | ✅ 已完成 | 采集→归一化→图谱构建全流程工作流 |
| Wave 3 - Agents/Demo | ✅ 已完成 | 9大分析Agent、报告生成Agent |
| Wave 4 - Application | ✅ 已完成 | 全栈应用:采集→分析→报告→可视化 |
| 年度总决赛 | 待推进 | 产品部署上线,开放市集体验 |
八、团队信息
| 角色 | 人数 | 说明 |
|---|---|---|
| 创始人/CEO | 1人 | 一人公司(OPC)模式运营 |
| AI智能体 | 8+ | 数据采集Agent×5、分析Agent×3、报告生成Agent×1 |