项目复盘
20MW级燃气轮机文献综述项目 — 完整工作流、问题梳理与经验总结
项目概述
本项目旨在对20MW级燃气轮机的10个主要型号进行系统性文献综述,涵盖国产及国际主流型号。通过多智能体并行工作模式,完成了从文献检索、筛选、综述撰写到网站展示的全流程。
10
燃气轮机型号
82+
学术论文
11
综述报告
102
PDF文献
工作流程
Phase 1: 文献检索与下载
基于10个燃气轮机型号关键词,从Google Scholar、ScienceDirect、ASME Digital Collection等数据库检索并下载学术论文。使用自动化脚本批量下载PDF,最终获取102篇PDF文献。
Phase 2: PDF解析与筛选
将PDF文件解析为Markdown格式,基于内容相关性进行筛选。去除不相关论文,保留与各型号直接相关的学术论文。筛选后保留82篇高质量论文。
Phase 3: 10型号并行综述 (OMC Team模式)
使用oh-my-claudecode的Team模式,启动10个并行Agent分别对10个燃气轮机型号进行独立综述。每个Agent读取对应型号的全部论文Markdown,撰写结构化综述报告。
Phase 4: 横向对比分析 (SciOMC模式)
使用SciOMC模式进行跨型号横向对比分析,提取性能参数,生成燃气轮机性能参数对比表(CSV)和结构化数据(JSON),完成总体综述报告。
Phase 5: 网站建设与部署
设计并实现文献综述展示网站,包含5个核心模块。使用纯静态HTML + 客户端Markdown渲染方案,部署至Nginx + Let's Encrypt SSL。
方法论
多智能体协作 (OMC Team)
项目核心采用oh-my-claudecode的Team模式进行大规模并行处理:
- 10型号并行综述:每个型号分配独立的Agent,同时阅读该型号所有论文并撰写综述,大幅缩短处理时间
- SciOMC科学分析:多个科学分析Agent并行工作,分别负责性能对比、技术趋势分析、结构化数据提取
- Ralph持久执行:关键任务使用Ralph模式确保完成,自动重试和验证
技术栈
- AI引擎:Claude (Anthropic) + oh-my-claudecode编排
- 文献管理:Python脚本自动化检索、下载、解析、筛选
- 网站技术:纯静态HTML + marked.js + highlight.js + Nginx
- 部署:Let's Encrypt SSL + Nginx反向代理
遇到的问题
| 问题 | 影响 | 处理方式 |
|---|---|---|
| Titan250目录论文实际为Titan130相关 | Titan250综述内容偏离 | 在综述报告中标注说明,保留原始论文但注明差异 |
| M90FR目录论文未直接提及该型号 | M90FR综述缺乏针对性技术数据 | 综述基于通用舰船燃气轮机技术,说明数据来源限制 |
| 技术主题横向对比Agent因Read工具limit=-1参数卡死 | 横向对比分析中断 | 改用分段读取策略,避免一次性加载大文件 |
| AGT15综述实际为航空发动机通用技术,非该型号具体参数 | AGT15缺乏型号专属技术数据 | 综述报告反映此限制,以航改燃机通用技术为主 |
| 多个国产型号(AGT15/20、CGT25、G15)公开数据有限 | 国产型号综述深度不足 | 以公开文献为准,如实反映数据披露状况 |
| 论文文件名含中英文混合及特殊字符 | URL编码和文件系统兼容性问题 | 使用URL编码处理中文路径,Python urllib.parse.quote |
| SGT-400/500论文的PDF存放在SGT500目录 | PDF映射需特殊处理 | 建立model→pdf_dir映射表,SGT-400_500映射到SGT500 |
型号覆盖情况
| 型号 | 厂商/国家 | 论文数 | PDF数 | 数据质量 |
|---|---|---|---|---|
| AGT-15 | 中国 | 8 | 8 | 中等(航空发动机技术为主) |
| AGT-20 | 中国 | 2 | 10 | 中等 |
| CGT-25 | 中国 | 2 | 2 | 较低(数据有限) |
| G15 | 中国 | 2 | 2 | 较低(数据有限) |
| L20A | 日本/川崎重工 | 7 | 7 | 高 |
| LM2500 | 美国/GE | 20 | 31 | 高 |
| M90FR | 俄罗斯 | 1 | 1 | 低(间接数据) |
| SGT-400/500 | 德国/西门子 | 27 | 26 | 高 |
| Titan 130 | 美国/Solar Turbines | 10 | 12 | 高 |
| Titan 250 | 美国/Solar Turbines | 3 | 3 | 中等 |
经验总结
- 并行化大幅提升效率:10个型号同时综述,总耗时从串行的数小时缩短至并行处理的数十分钟
- 文献筛选质量决定综述质量:早期筛选不严格导致部分型号综述偏离,后续需加强相关性审查
- 国产型号数据获取困难:多个国产燃气轮机型号缺乏公开技术文献,限制了综述深度
- 文件名规范化很重要:中英文混合文件名和特殊字符增加了自动化处理的复杂度
- 工具限制需提前规避:Read工具的limit参数限制需要通过分段读取策略绕过
- PDF-Markdown映射需精确:不同目录结构和文件名差异导致映射复杂,需建立明确的映射规则
后续工作
- 补充国产型号(AGT15/20、CGT25、G15)的技术数据
- 增加更多M90FR/UGT系列的俄文文献
- 开发交互式性能对比可视化工具
- 定期更新论文库,追踪最新研究进展
- 考虑迁移至Hugo等静态站点生成器以支持更复杂的内容管理
本项目由 oh-my-claudecode (OMC) 多智能体系统驱动完成 · Claude (Anthropic) 提供 AI 能力
项目日期:2026年4月 · 版本:1.0