项目复盘

20MW级燃气轮机文献综述项目 — 完整工作流、问题梳理与经验总结

项目概述

本项目旨在对20MW级燃气轮机的10个主要型号进行系统性文献综述,涵盖国产及国际主流型号。通过多智能体并行工作模式,完成了从文献检索、筛选、综述撰写到网站展示的全流程。

10
燃气轮机型号
82+
学术论文
11
综述报告
102
PDF文献

工作流程

Phase 1: 文献检索与下载

基于10个燃气轮机型号关键词,从Google Scholar、ScienceDirect、ASME Digital Collection等数据库检索并下载学术论文。使用自动化脚本批量下载PDF,最终获取102篇PDF文献。

Phase 2: PDF解析与筛选

将PDF文件解析为Markdown格式,基于内容相关性进行筛选。去除不相关论文,保留与各型号直接相关的学术论文。筛选后保留82篇高质量论文。

Phase 3: 10型号并行综述 (OMC Team模式)

使用oh-my-claudecode的Team模式,启动10个并行Agent分别对10个燃气轮机型号进行独立综述。每个Agent读取对应型号的全部论文Markdown,撰写结构化综述报告。

Phase 4: 横向对比分析 (SciOMC模式)

使用SciOMC模式进行跨型号横向对比分析,提取性能参数,生成燃气轮机性能参数对比表(CSV)和结构化数据(JSON),完成总体综述报告。

Phase 5: 网站建设与部署

设计并实现文献综述展示网站,包含5个核心模块。使用纯静态HTML + 客户端Markdown渲染方案,部署至Nginx + Let's Encrypt SSL。

方法论

多智能体协作 (OMC Team)

项目核心采用oh-my-claudecode的Team模式进行大规模并行处理:

技术栈

遇到的问题

问题影响处理方式
Titan250目录论文实际为Titan130相关 Titan250综述内容偏离 在综述报告中标注说明,保留原始论文但注明差异
M90FR目录论文未直接提及该型号 M90FR综述缺乏针对性技术数据 综述基于通用舰船燃气轮机技术,说明数据来源限制
技术主题横向对比Agent因Read工具limit=-1参数卡死 横向对比分析中断 改用分段读取策略,避免一次性加载大文件
AGT15综述实际为航空发动机通用技术,非该型号具体参数 AGT15缺乏型号专属技术数据 综述报告反映此限制,以航改燃机通用技术为主
多个国产型号(AGT15/20、CGT25、G15)公开数据有限 国产型号综述深度不足 以公开文献为准,如实反映数据披露状况
论文文件名含中英文混合及特殊字符 URL编码和文件系统兼容性问题 使用URL编码处理中文路径,Python urllib.parse.quote
SGT-400/500论文的PDF存放在SGT500目录 PDF映射需特殊处理 建立model→pdf_dir映射表,SGT-400_500映射到SGT500

型号覆盖情况

型号厂商/国家论文数PDF数数据质量
AGT-15中国88中等(航空发动机技术为主)
AGT-20中国210中等
CGT-25中国22较低(数据有限)
G15中国22较低(数据有限)
L20A日本/川崎重工77
LM2500美国/GE2031
M90FR俄罗斯11低(间接数据)
SGT-400/500德国/西门子2726
Titan 130美国/Solar Turbines1012
Titan 250美国/Solar Turbines33中等

经验总结

  1. 并行化大幅提升效率:10个型号同时综述,总耗时从串行的数小时缩短至并行处理的数十分钟
  2. 文献筛选质量决定综述质量:早期筛选不严格导致部分型号综述偏离,后续需加强相关性审查
  3. 国产型号数据获取困难:多个国产燃气轮机型号缺乏公开技术文献,限制了综述深度
  4. 文件名规范化很重要:中英文混合文件名和特殊字符增加了自动化处理的复杂度
  5. 工具限制需提前规避:Read工具的limit参数限制需要通过分段读取策略绕过
  6. PDF-Markdown映射需精确:不同目录结构和文件名差异导致映射复杂,需建立明确的映射规则

后续工作


本项目由 oh-my-claudecode (OMC) 多智能体系统驱动完成 · Claude (Anthropic) 提供 AI 能力
项目日期:2026年4月 · 版本:1.0