【S1W2 交叉测评】 #4

Open
opened 2026-05-15 21:47:00 +08:00 by Hilnn · 0 comments
  1. 项目理解

我理解这个项目主要想解决传统企业研报分析流程中“信息分散、人工阅读成本高、研究效率低”的问题。当前投研工作通常需要分析师手动阅读大量 PDF 报告、财务数据和行业资料,再结合公开网络信息进行综合判断,整个过程耗时较长,且知识沉淀困难。

该项目通过“企业研报智能体”的方式,将:

  • PDF 文档解析
  • 向量检索
  • 多轮问答
  • 联网调研
  • 自动报告生成
  • 财务指标抽取
  • 企业能力评分

整合到统一工作流中,形成完整的企业研究闭环。

系统核心流程包括:

validate_scope
→ retrieve_evidence
→ web_research
→ generate
→ persist_result

整体目标是让 AI 不仅能够“回答问题”,还能够像投研助手一样:

  • 阅读企业资料
  • 检索关键证据
  • 补充行业背景
  • 自动生成分析报告
  • 输出结构化企业评分

本项目更偏向“AI 投研工作流平台”,而不仅是普通 RAG 问答系统。


  1. 项目优点

(1)整体工作流较完整

项目不仅实现了简单问答,还覆盖:

  • 知识库管理
  • 文件生命周期
  • RAG 检索
  • 联网调研
  • 报告生成
  • 财务指标提取
  • 企业评分
  • PDF 导出

已经形成较完整的 AI 投研流程。

(2)LangGraph 工作流设计较规范

项目采用:

  • validate_scope
  • retrieve_evidence
  • web_research
  • generate
  • persist_result

这种节点化流程设计,使系统结构清晰,也方便后续扩展复杂 Agent 能力。

(3)内部知识与联网信息分离较合理

项目明确区分:

  • 内部证据引用 [1][2]
  • 联网资料引用 [W1][W2]

并强调“内部知识优先,网络信息作为补充”,这一点符合真实投研场景对可信度的要求。

(4)支持结构化财务信息抽取

系统不仅处理文本,还支持:

  • 表格抽取
  • 财务指标识别
  • 企业能力评分

相比普通聊天式 RAG,更贴近真实金融分析需求。

(5)支持 Mock 降级模式

即使没有:

  • API Key
  • Milvus
  • HuggingFace 模型

系统仍可运行 mock 流程,说明项目对比赛演示和离线环境适配考虑较充分。

(6)前后端功能较完整

项目不仅有后端 Agent 能力,还提供:

  • React 前端
  • PDF 在线预览
  • 历史记录
  • Markdown/PDF 导出

整体 Demo 完整度较高。


  1. 当前问题

(1)当前更偏“RAG 工作流整合”

虽然项目使用 LangGraph 和 Agent 概念,但核心能力目前仍主要是:

  • 检索
  • 拼接上下文
  • 调用 LLM 生成

真正复杂的投研推理能力仍然有限。

(2)企业评分机制透明度不足

企业能力评分虽然是亮点,但目前:

  • 权重来源
  • 评分逻辑
  • 指标解释

描述还不够详细。

如果评分缺少透明度,容易影响结果可信度。

(3)联网信息可靠性存在风险

项目通过 DuckDuckGo 补充外部信息,但联网搜索可能出现:

  • 信息过时
  • 新闻真实性不足
  • 来源质量不稳定

在金融投研场景中,这类风险需要特别注意。

(4)复杂财务表格解析能力未知

虽然支持表格抽取,但尚未验证:

  • 扫描版 PDF
  • 复杂跨页表格
  • 图表数据
  • 非标准财报格式

真实企业报告中这些情况较常见。

(5)长报告生成可能存在幻觉问题

即使有 RAG 支持,长篇投研报告仍可能出现:

  • 证据不足
  • 逻辑跳跃
  • 生成性幻觉
  • 财务结论不严谨

特别是在联网信息参与时风险更高。


  1. 建议

(1)增强真实投研推理能力

后续建议不仅停留在:

  • 检索
  • 摘要生成

还可以增加:

  • 财务趋势分析
  • 同行业对比
  • 风险因子分析
  • 增长逻辑推理

提升系统真正的“投研能力”。

(2)增加评分体系可解释性

建议对企业评分增加:

  • 权重说明
  • 评分依据
  • 证据映射
  • 指标贡献度

提升用户对评分结果的信任度。

(3)加强联网信息质量控制

建议增加:

  • 来源可信度过滤
  • 金融网站白名单
  • 新闻时间权重
  • 信息去重机制

减少联网资料带来的误导风险。

(4)增强复杂 PDF 解析能力

后续可增加:

  • OCR 支持
  • 图表解析
  • 跨页表格识别
  • 财报结构理解

提升真实企业文档适配能力。

(5)增加多企业横向分析能力

目前项目更偏单企业分析,后续建议增加:

  • 企业对比
  • 行业排名
  • 同赛道竞争分析
  • 自动 Benchmark

这会更符合真实投研需求。

(6)加强金融场景可靠性验证

建议通过:

  • 人工分析师评测
  • 真实研报对比
  • 财务指标准确率测试
  • 幻觉率统计

验证系统输出是否真正具备投研参考价值。

1. 项目理解 我理解这个项目主要想解决传统企业研报分析流程中“信息分散、人工阅读成本高、研究效率低”的问题。当前投研工作通常需要分析师手动阅读大量 PDF 报告、财务数据和行业资料,再结合公开网络信息进行综合判断,整个过程耗时较长,且知识沉淀困难。 该项目通过“企业研报智能体”的方式,将: - PDF 文档解析 - 向量检索 - 多轮问答 - 联网调研 - 自动报告生成 - 财务指标抽取 - 企业能力评分 整合到统一工作流中,形成完整的企业研究闭环。 系统核心流程包括: validate_scope → retrieve_evidence → web_research → generate → persist_result 整体目标是让 AI 不仅能够“回答问题”,还能够像投研助手一样: - 阅读企业资料 - 检索关键证据 - 补充行业背景 - 自动生成分析报告 - 输出结构化企业评分 本项目更偏向“AI 投研工作流平台”,而不仅是普通 RAG 问答系统。 -------------------------------------------------- 2. 项目优点 (1)整体工作流较完整 项目不仅实现了简单问答,还覆盖: - 知识库管理 - 文件生命周期 - RAG 检索 - 联网调研 - 报告生成 - 财务指标提取 - 企业评分 - PDF 导出 已经形成较完整的 AI 投研流程。 (2)LangGraph 工作流设计较规范 项目采用: - validate_scope - retrieve_evidence - web_research - generate - persist_result 这种节点化流程设计,使系统结构清晰,也方便后续扩展复杂 Agent 能力。 (3)内部知识与联网信息分离较合理 项目明确区分: - 内部证据引用 [1][2] - 联网资料引用 [W1][W2] 并强调“内部知识优先,网络信息作为补充”,这一点符合真实投研场景对可信度的要求。 (4)支持结构化财务信息抽取 系统不仅处理文本,还支持: - 表格抽取 - 财务指标识别 - 企业能力评分 相比普通聊天式 RAG,更贴近真实金融分析需求。 (5)支持 Mock 降级模式 即使没有: - API Key - Milvus - HuggingFace 模型 系统仍可运行 mock 流程,说明项目对比赛演示和离线环境适配考虑较充分。 (6)前后端功能较完整 项目不仅有后端 Agent 能力,还提供: - React 前端 - PDF 在线预览 - 历史记录 - Markdown/PDF 导出 整体 Demo 完整度较高。 -------------------------------------------------- 3. 当前问题 (1)当前更偏“RAG 工作流整合” 虽然项目使用 LangGraph 和 Agent 概念,但核心能力目前仍主要是: - 检索 - 拼接上下文 - 调用 LLM 生成 真正复杂的投研推理能力仍然有限。 (2)企业评分机制透明度不足 企业能力评分虽然是亮点,但目前: - 权重来源 - 评分逻辑 - 指标解释 描述还不够详细。 如果评分缺少透明度,容易影响结果可信度。 (3)联网信息可靠性存在风险 项目通过 DuckDuckGo 补充外部信息,但联网搜索可能出现: - 信息过时 - 新闻真实性不足 - 来源质量不稳定 在金融投研场景中,这类风险需要特别注意。 (4)复杂财务表格解析能力未知 虽然支持表格抽取,但尚未验证: - 扫描版 PDF - 复杂跨页表格 - 图表数据 - 非标准财报格式 真实企业报告中这些情况较常见。 (5)长报告生成可能存在幻觉问题 即使有 RAG 支持,长篇投研报告仍可能出现: - 证据不足 - 逻辑跳跃 - 生成性幻觉 - 财务结论不严谨 特别是在联网信息参与时风险更高。 -------------------------------------------------- 4. 建议 (1)增强真实投研推理能力 后续建议不仅停留在: - 检索 - 摘要生成 还可以增加: - 财务趋势分析 - 同行业对比 - 风险因子分析 - 增长逻辑推理 提升系统真正的“投研能力”。 (2)增加评分体系可解释性 建议对企业评分增加: - 权重说明 - 评分依据 - 证据映射 - 指标贡献度 提升用户对评分结果的信任度。 (3)加强联网信息质量控制 建议增加: - 来源可信度过滤 - 金融网站白名单 - 新闻时间权重 - 信息去重机制 减少联网资料带来的误导风险。 (4)增强复杂 PDF 解析能力 后续可增加: - OCR 支持 - 图表解析 - 跨页表格识别 - 财报结构理解 提升真实企业文档适配能力。 (5)增加多企业横向分析能力 目前项目更偏单企业分析,后续建议增加: - 企业对比 - 行业排名 - 同赛道竞争分析 - 自动 Benchmark 这会更符合真实投研需求。 (6)加强金融场景可靠性验证 建议通过: - 人工分析师评测 - 真实研报对比 - 财务指标准确率测试 - 幻觉率统计 验证系统输出是否真正具备投研参考价值。
Sign in to join this conversation.
No labels
No milestone
No project
No assignees
1 participant
Notifications
Due date
The due date is invalid or out of range. Please use the format "yyyy-mm-dd".

No due date set.

Dependencies

No dependencies set.

Reference
Z2wen1tao_31/S1W2-Enterprise-Research-Report-Agent#4
No description provided.