燃气轮机作为国家能源核心装备,广泛应用于舰船、飞机及海上平台,但长期存在运维数据分散、结构化不足等瓶颈,制约智能诊断与运维升级。依托覆盖200余台机组、15年以上多源运维数据,创新“工具链+智能解析+人工优化”模式,构建行业首个覆盖全生命周期的高质量数据集,支撑智能运维大模型落地,推动能源装备运维能力迈向国际领先。
方案和成效
一是夯实基础,构建全生命周期语料体系。统筹设计、运行、维护、故障等多源数据,结合外部权威文献与专家经验,建立“采集—清洗—结构化—标注—入库”的标准化流程,累计处理语料8000余份,形成六大典型子集和超300万训练Tokens,为智能诊断提供高质量底座。
二是协同共建,推动应用场景落地。联合设备厂家、科研院所和运行单位,建立语料标准与共享机制,打通多型号机组数据接口,形成“AI+燃机”协同生态。面向业务梳理8类43个应用场景,率先实现“智能截图解读”“报告结构化生成”“手册对话问答”等功能,已在TES3.0系统和205台机组规模化应用。
三是赋能行业,提升运维效能与国家保障。依托“海能”模型构建全生命周期诊断体系,在极端环境下显著降低停机风险,实现“零宕机、零事故”目标。典型故障响应由3天压缩至4小时,人工分析减少70%,累计提前预警260余起、避免损失上亿元,推动行业由“经验驱动”向“智能赋能”转型,为国家能源安全和产业高质量发展提供有力支撑。
创新点
一是构建专家+AI协同体系。建立“专家+AI工程师+知识工程师”三位一体机制,实行语料责任制和双重校核,由设备专家终审语义,确保数据权威性,增强模型推理与诊断深度。
二是形成语料智能处理闭环。研发OCR与结构标注一体化工具链,突破图文混合、格式复杂难题,实现“识别—清洗—重建—标注”自动化,大幅提升语料处理效率与一致性,满足大模型高质量输入。
三是打造可追溯语料资产体系。引入全生命周期与版本化管理,覆盖来源、版本、责任人等元信息,支持快速检索与精调,建立可审计、可演进的数据底座,保障大模型长期稳定发展。