践行深度用云矿山智能化暨矿山大模型最佳实践白皮书27 27编委主任编委顾问编委会委员编写成员责任编辑李 伟 邹志磊刘 健 王立才 韩 硕 蒋旺成 郭振兴 刘 维 尤 鹏 胡玉海 王 飞徐加利 刘 波 曹怀轩 胡立全 项 凌 杨加元 赵 强 陈文丰 顾兴勇 贡 青赵金娥 张 浩 高 桢 张 硕 潘临安 李吉宗 李 杨 谭 伟 曾祖祥 王 宁 张强豪 刘汝琪 高 昊 陈 航 陈泽腾 周志获 王 军 贺 帅蒙俊秀 王 瑞编制委员会preparation committee(排名不分先后) 炭行业作为我国重要的传统能源行业,其智能化建设直接关系我国国民经济和社 会智能化的进程,将人工智能、工业物联网、云计算等ict技术与现代煤炭开发利用深度融合,对提升煤矿安全生产水平、保障煤炭稳定供应具有重要意义。但当前煤炭行业智能化建设工作依然存在资金投入不足、技术标准不一、技术装备落后、研发平台不健全、高端人才匮乏等问题,导致智能化建设滞后于其他行业。同时,传统人工智能开发模式局限于特定的行业场景、特定的数据,面临碎片化、定制化、门槛高等问题,导致无法大规模复制的挑战。近年来,山东能源集团投入200多亿元进行矿井智能化建设,9对国家级智能化示范矿井全部通过验收,在煤矿智能化建设路上走在了全国前列。2022年山东能源集团与华为公司成立联合创新中心,重点围绕煤炭开发利用重大科技需求,叠加双方科学技术、应用场景、行业双跨专家等优势资源,在智能化煤矿建设、煤矿安全管控等领域形成了一批可复制推广的尊龙凯时人生就博的解决方案。山东能源集团引入华为云stack构建集团总部训练、生产单位边缘推理的云边协同架构,满足“数据不出企”的要求,基于盘古大模型实现人工智能开发模式从“作坊式”到“工业化”的升级迭代,探索出一套可复制的工业化人工智能生产方案,初步实现煤炭行业从人工管理到智能化管理、从被动管理到主动管理的转变。当前,山东能源集团已在兴隆庄煤矿、李楼煤业、济二煤矿等单位开发和实施首批场景应用,实现实时优化工艺参数、识别故障与异常、审核作业规范,以广播提醒、设备联动等方式实现了自动处置闭环,形成了一批应用成果。未来,我们将在盘古视觉大模型和盘古预测大模型的基础上,采用盘古自然语言和多模态大模型,进一步做深决策智慧、企业管理智能化能力。我们将在矿业智能化的基础之上,辐射能源集团其他五大业务板块,加速全产业智能化建设,坚持开放合作、与“巨人”同行,持续深化与华为在技术、管理、文化等方面的交流合作,基于华为云stack云边协同方案,将盘古大模型复制推广到其他行业,打造行业领先的ai应用平台,深度用云,让行业客户都拥有自己的专属大模型,加速行业智能升级!李伟山东能源集团 党委书记 董事长煤0227序言preamble 前言 1956年达特茅斯会议首次提出人工智能概念以来,人工智 能一直在业界广泛应用。2022年,生成式人工智能系统为代表的大模型,在多项测试中超越人类平均水平,推动了人工智能领域的新一轮创新浪潮。2019年,华为立项研发盘古大模型,历时三年,投入大量人力物力。盘古大模型致力于深耕行业,打造多领域行业大模型和能力集,积极开展行业合作,持续提升在行业领域的专业性,助力行业实现智能升级。2022年,华为与山东能源集团有限公司(以下简称山东能源)及旗下公司云鼎科技股份有限公司(以下简称云鼎科技)达成了战略合作关系,把盘古大模型应用于煤炭行业,在山东能源实现了华为云盘古矿山大模型(以下简称矿山大模型)的落地实践,加速了山东能源的智能化发展。本白皮书全面总结了矿山大模型在山东能源的实践经验,从趋势、方案、运营、商业等方面阐述了我们的实践思路和方法,同时辅以具体的落地场景,期待为各行各业使用大模型提供参考。目前,矿山大模型的实践还在持续开展,我们还将探索自然语言处理、多模态等形态大模型在煤炭行业的应用,随着未来实践的深入,我们的认识也将进一步深化,对白皮书存在的不足之处,欢迎大家批评指正。foreword自0327 目录directory1.1 大模型引领人工智能发展方向1.3 面向大模型的配套建设已经起步1.2 大模型深入行业,引发范式变革大模型跑步进入展开期各行业迎来发展新范式012.1 矿山智能化正稳步推进2.3 矿山智能化现状挑战2.2 矿山企业确立智能化发展战略2.4 矿山大模型基于"1 4 n"架构推动矿山智能化升级盘古大模型为行业而生赋能矿山转型升级023.1 关键实践措施阐述3.3 数据安全和模型安全实践3.2 矿山典型业务场景的建设实践矿山大模型最佳建设实践032706-0910-1314-23 24-2728-3132-334.1 目标与挑战4.3 专业服务体系建设实践4.4 模型运营管理实践4.2 运营组织体系建设实践矿山大模型最佳运营实践045.1 拓展创新利益联结机制,协同共生、合作共赢5.3 实现战略、组织匹配,标准动作推动落地5.2 面向煤炭行业构建三种矿山大模型落地途径矿山大模型最佳商业实践056.1 “大一统”模式构筑企业智能化基座6.3 通过持续运营,释放大模型的价值与潜力6.4 开放思维合作共赢,赋能伙伴成就客户6.2 模型与业务适配,大小模型协同发展矿山大模型为“ai for industries”提供最佳实践指导0627 大模型跑步进入展开期各行业迎来发展新范式大模型跑步进入展开期各行业迎来发展新范式大模型跑步进入展开期各行业迎来发展新范式大模型跑步进入展开期各行业迎来发展新范式大模型跑步进入展开期各行业迎来发展新范式各行业迎来发展新范式各行业迎来发展新范式各行业迎来发展新范式各行业迎来发展新范式各行业迎来发展新范式0627 近年来,人工智能技术发展迅猛,大模型在人工智能发展方向上发挥了重要的引领作用。大模型以其巨大的模型参数规模、大数据预训练和对强大计算能力的需求而著称。通过对大量数据集的预学习,大模型展现出卓越的模型精度和泛化能力,为众多领域提供了革命性的尊龙凯时人生就博的解决方案。以自然语言大模型为例,大模型在处理自然语言任务时表现出了惊人的能力。当模型参数规模达到600多亿时,大模型在翻译和数学能力方面表现出色。当模型参数增加到1300亿时,大模型具备了上下文学习和处理复杂任务的能力。而当模型参数增加到5300亿时,大模型展示出知识组合和情感感知的能力。大模型的智能化表现不仅仅局限于特定的任务。它还实现了从感知理解到生成创造、从专用到通用的全面智能化探索,为我们带来了无尽的创新空间,引领了一场方兴未艾的科技革命和产业变革。国内外多款生成式自然语言大模型的火热出圈,让大众对大模型能进行对话、写诗、作画等任务不再陌生,但这只是大模型应用的冰山一角。大模型只有深入到工业制造、金融科技、生物医药、科学研究等众多行业领域开展应用,才能真正发挥其巨大潜力。面对行业垂直领域的复杂任务,单一形态的大模型显然难以胜任,这就需要多种形态的大模型,来应对行业不同场景。1.1 大模型引领人工智能发展方向1. 视觉大模型视觉大模型(以下简称cv大模型)基于海量图像、视频数据和独特技术构筑的视觉基础模型,赋能行业客户,利用少量场景数据对模型微调即可实现特定场景任务。以煤炭行业为例,视觉大模型在出厂前经过上亿视频、图像数据的预训练,提高了模型的泛化性和精度,让矿山碎片化的长尾场景模型从“作坊式”开发,走向基于一个大模型的持续“工业化”生产,极大的降低了长期运营成本。2. 预测大模型预测大模型是面向结构化类数据,基于基础模型空间,通过模型推荐、融合两步优化策略,构建图网络架构的ai模型,实现生产工艺优化、供应链调度优化等场景的最优参数控制。仍以煤炭行业为例,预测大模型结合了采集的原煤检验、精煤检验和生产过程数据,实现模型的自动选择和预测方法的自动优化,最终得到重介质洗选方案的最优化参数,下发到生产自控系统,有效保证了产品质量。1.2 大模型深入行业,引发范式变革0727 3. 自然语言处理大模型自然语言处理大模型(以下简称nlp大模型)利用大数据预训练,结合多源丰富知识,通过持续学习吸收海量文本数据,不断提升模型效果。在实现行业知识检索回答、文案生成、阅读理解等基础功能的同时,具备代码生成、插件调用、模型调用等高阶特性。以政企场景为例,nlp大模型帮助政企客户脱离“文山会海”的困扰。利用其阅读理解和文案生成能力,实现15种公文规范化生成,公文撰写从原先耗时周级降至天级,同时原先会议流水账被改写成标准会议议程;利用其语义搜索能力,实现最佳文档资料推荐,海量公文查找从天级降至分钟级。4. 多模态大模型多模态大模型融合语言和视觉跨模态信息,实现图像生成、图像理解、3d生成和视频生成等应用,面向产业智能化转型提供跨模态能力底座。以金融行业7*24小时智能自助服务场景为例,多模态大模型结合音视频通话、电话语音、文字交互形式,摆脱单一固定类型的限制,用多模态情感计算替代打分评价,获取客户真实有效的反馈,完善客户的情感分析,实现对客户意图、行为的全方面判断,针对不同客户打造“聊得来”的个性化智能客服,实现精准化、个性化、有温度的金融服务。5. 科学计算大模型科学计算大模型采用ai数据建模和ai方程求解的方法,从海量的数据中提取出数理规律,使用神经网络编码微分方程更快更准的解决科学计算问题。以气象领域为例,华为云为行业提供盘古气象大模型,在四十多年的全球天气数据上训练深度神经网络,能够提供全球气象秒级预报,其气象预测结果包括位势、湿度、风速、温度、海平面气压等,由欧洲中期预报中心和中央气象台等实测验证,其在精度和速度方面超越传统数值预测方法。1. 人工智能已上升为国家战略,配套政策逐步完善人工智能作为驱动第四次工业革命的重要引擎,深刻影响着经济、产业和各技术学科的发展。为此,世界主要国家纷纷把人工智能在社会各领域的创新发展提升到国家战略地位。2017年,中国发布了《新一代人工智能发展规划》,旨在构筑人工智能发展的先发优势。 2023年,中国发布了《生成式人工智能服务管理暂行办法》,《办法》为大模型的产业创新提供了政策导向和法律保障,也为产业监管提供了科学合理和平衡适度的框架。2. 人工智能算力网建设,提供基础的算力底座大模型时代,算力是重要生产力,在“东数西算”战略的推动下,智算中心、超算中心和一体化大数据中心已成为国家新基建的重要部分。2022年6月,“中国算力网”一期工程“智算网络”正式上线,以“鹏城云脑”为枢纽节点,跨域纳管了20余个异构算力中心,汇聚算力规模超3e flops,建成全国智能算力互联体系,实现算力与ai开源服务向全国用户开放。1.3 面向大模型的配套建设已经起步0827 3. 数据要素治理探索转向,将促进数据价值释放《“十四五”大数据产业发展规划》强调,推动行业数据资产化、产品化,数据要素治理的探索逐渐转向规范数据资源的市场化流通。2023年,国务院组建了国家数据局,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用。这些举措将为大模型的发展提供必要的生产资料。4. 人工智能进入“百模大战”的新时代科技部新一代人工智能发展研究中心发布的《中国人工智能大模型地图研究报告》显示,我国研发的大模型数量位居全球第二,目前中国10亿参数规模以上的大模型已发布79个,进入“百模大战”的新时代,充分体现了我国在大模型领域的创新实力和发展潜力。27 盘古大模型为行业而生赋能矿山转型升级1027 过以上举措,持续推动智能化建设提档升级。煤炭行业推进智能化建设,依赖人工智能技术的支持,但传统单场景小模型方案存在诸多问题,制约了矿山智能化、规模化建设的发展。以矿山智能应用的业务视角分析单场景小模型方案,存在以下问题:模型可移植性差。传统模式针对一个矿山开发的模型无法直接复用到其它矿山,在一个生产单位训练的模型,转至其它单位应用时准确度明显下降,模型泛化性不