油气行业是关乎国家能源安全的重要支柱产业,油气行业实现高质量发展的核心在于以人工智能、物联网、云计算等新一代信息技术为支撑,推动数字技术与油气核心业务深入结合,通过数字化、智能化赋能加快推动油气行业转型,积极培育和发展油气行业的战略性产业和未来产业。
油气行业正在积极探索人工智能大模型技术应用,探索人工智能大模型在研发设计、中试验证、生产经营、安全环保、营销服务等方面的人工智能应用场景落地,加快科技创新成果向现实生产力转化,不断塑造高质量发展的新动能,以数字技术催生新的生产力。
星云大模型助力构建油气大模型
油气行业专业多,涉及的知识面庞大,同时业务流程复杂,场景众多,面向油气行业场景构建高质量、安全、高效的油气大模型成为挑战。
油气大模型的构建基于上百万份的石油石化百科知识、专业书籍、文献、标准、图片、视频,以及油气行业各类方案、数据库,通过对这些海量知识的挖掘利用、训练和精调,中兴通讯在星云大模型的基础上构建油气领域的行业大模型,精准把握油气领域的核心知识和规律,为用户提供一站式服务。
如图1所示,星云大模型包括语言大模型、视觉大模型、多模态大模型。
星云大模型按需提供全解耦的算力服务,满足大模型训练、训推混合、边缘训推等各种场景需求,提供大模型开发全流程工具和引擎,包括数据标注、模型训练、微调、模型编译、量化压缩和应用开发平台,助力油气行业业务集成商(SI)打通技术到应用的全链条。
星云大模型在油气行业的场景应用
油气大模型典型应用包括油气知识库、智能问数应用、方案报告快速生成、油气田作业监督等。油气大模型应用场景如图2所示。
基于RAG(检索增强生成)向量知识库构建的油气知识库,不仅可以对用户提出的问题进行解释,而且对结果进行精准溯源。油气行业标准规范众多,可以基于油气知识库进行标准规范内容的查询检索,并可以查看到回答的依据是来自于哪一篇标准规范,对现场问题给出针对性的建议。星云大模型不仅支持纯文本格式、办公文档格式语料文件,也支持带图片的PDF、图像文件格式;除了支持公式外,也支持统计图表,以及对复杂表格内容及语义的提取,更精准地实现模型训练和精调。星云大模型采用“基于定制语料的RAG”“基于定制组件的RAG”等多种技术手段,实现了知识问答准确率超过90%。基于RAG向量数据库,既保证了大模型回答的准确性,又保证了知识的实时更新。
基于智能体,油气大模型实现面向经营、生产数据的智能问数应用。利用大模型NL2SQL(自然语言转SQL)的能力,将问题解析并转化为SQL查询语句,通过智能体在后台关联的数据库进行智能查询,并将结果进行可视化展示。智能体自动读取表结构和内容,实现对结构化数据的处理。这样业务人员就可以用自然语言查询油井数量、每口井的详细信息和产量,也可以对生产日报中的数据进行精准问答,通过交互式问答快速了解油田每天的生产情况。油气行业术语、行话众多,星云大模型通过精调实现了油气行业术语或行话的自动识别和转换,提升交互效率和信息输出的准确率。
此外,星云大模型利用事先建立的指标和维度树,通过智能体自动拆解异常指标,实现自动预警、根因分析、关联分析(比如给出影响指标波动的最大贡献子指标)。星云大模型对原始数据进行治理,通过指标、维度对数据统一建模,要求按统一建模术语问数,实现“任意表随便问”效果,使得复杂查询准确率提升到95%。
星云大模型实现油气行业各类方案的快速生成,包括开发方案、安全方案等。星云大模型支持灵活的主题输入、大纲编辑、自动化图文内容生成、模版选择与输出。根据方案模板,大模型生成初版内容,并提供自动续写、总结、润色等功能,针对报告内容推荐知识库里的相关内容。例如在勘探开发领域,在盆地评价的全过程中辅助研究人员分析构造、储层等情况,快速编写盆地评价报告。在编写报告中提供内容的自动生成,同时推荐和本盆地相关的图表、相关参数、相关文本。
星云大模型实现了油气行业报告智能解读,通过智能体对油气行业报告中的数据进行分析、解读,形成结论,对多个文档进行总结,可以根据多文档内容进行交互式问答,有效减轻管理人员和科研人员的日常工作负担。
油气田作业监督,基于多模态大模型对作业设计报告内容的理解和作业现场视频的自动分析,通过对比发现作业施工过程中的施工安全风险、质量问题和工艺流程问题。基于星云大模型提供对采油工人的作业培训,指导采油工人应用专业仪器,并在施工现场进行作业指导。
在大模型应用之前,油气行业积极探索小模型的应用已经初见成效,但在部分场景,需要通过大模型进行提升。比如对于火焰识别,在下雨水面反光或者闪电、汽车打灯,小模型会产生误报。通过大小模型协同,用星云大模型进行复核,可以快速提升识别准确率。
星云大模型部署
油气行业应用AI大模型的场景丰富多样,星云大模型支持多场景全开放的解耦部署。
在集团层面,可以选择Center版,部署在云数据中心。星云大模型提供全栈工具,帮助客户零门槛实现万亿级模型训练和开发。
对于二级油气田,存在数据安全不出域、既有推理又有训练的要求,可以选择Campus版。中兴通讯发布业界领先的训推一体机,提供全栈智算能力,一站式交付,开箱即用。
对于采油、勘探等作业现场,存在着多样化场景的部署需求,可以选择Site版,星云大模型提供多形态终端满足各种场景需求,通过云端协同提升运维效率,通过大小模型协同提升准确率。
星云油气大模型应用案例
中兴通讯为某油田建设了大模型平台,提供安全知识库和面向生产经营数据的智能问数能力。
安全知识库实现了多元化的问答场景,包括标准规范查询、案例参考、安全方案参考等。该项目将安全知识库、RAG技术和软提示词三者结合,显著提升问答系统的准确率,达到90%以上。根据作业任务要求,结合安全操作标准、规程、安全方案模版,星云大模型自动生成安全方案,包括文本、图片、摘要、总结等。
该项目实现了生产经营数据的智能问数服务。对于日报中的复杂问题和生产数据的细节查询,星云大模型能够迅速从海量的数据中检索出相关信息,并结合上下文生成精准、详细的答案。星云大模型能够理解并解析日报中的关键信息,如经营数据、市场趋势等,并为用户提供相应的分析和建议。在生产数据分析中,星云大模型通过智能体实时监控生产线的各项数据,并为用户提供实时的生产情况报告和异常预警。
经测试验证,基于星云大模型,科研资料采集时间由原来的1~2周缩短为1~2天,方案编制时间减少40%,新员工培养周期降低50%。
大模型在油气行业的应用正蓬勃发展,应用场景是基础,坚持以场景承载价值,技术的繁荣最终将体现为应用的繁荣。
中兴通讯坚持开放解耦原则,联合油气行业合作伙伴,通过软硬解耦、算网解耦、训推解耦、模型解耦,推动能力组件化和共享赋能,加速人工智能大模型场景的创新、研发、应用和商业化进程,构建开放的技术生态,加强产业生态协同研发与集成创新,推进数智技术与石油石化技术创新深度融合,培育一批综合性强、带动面广的数智化场景,推动油气开采、生产组织、运营管理、技术研发和商业模式创新。