《制造业大模型的构建与实践》(郭秉义著) 书评和思考

声明:所有斜体内容均为引用自书中内容
其余内容为原创,禁止任何形式的私自转载

书评

内容概要

《制造业大模型的构建与实践》(郭秉义著) 书评和思考

制造业大模型的构建与实践,郭秉义著,感觉是一本较平庸的著作,但用于快速扫盲、打发时间也是一个不错的选择。

第一章是一般意义上大模型的基本概念,以及大模型与制造业之间的关系。第二章进一步介绍大模型的功能原理层面,首先回溯AI发展的历史,然后再对现有大模型的基础架构transformer的由来和原理做了较为全面的介绍。第三章开始考虑大模型如何构建的问题,对数据集准备、tokenization、词嵌入、模型训练的过程全部梳理了一遍。第四章接着考虑模型训练之后的微调和对齐。第五章拓展到了处于当前研究前沿的多模态大模型。第六章又对提示词工程做了一些介绍。

以上是对大模型本身在知识、原理、技术层面上的引导和介绍部分,而后面几章相对松散,分别讨论了构造面向制造业企业应用大模型的技术路线(包括微调通用大模型和RAG)、AI Agent、大模型、大模型实际部署和压缩的技术。

第10章和第11章开始真正具体讲解工业领域大模型的实际案例,以及它们可能的应用场景,包括排产(运筹,资源调度)、工艺优化(多模态任务,参数调控自动化、智能化)、产品质检(视觉/多模态任务)、设备运维(多模态任务,传感器信息->设备监测评估结果)。

第12章做一些空泛的总结展望。

总体来说,这本书乏善可陈,灌水严重,对于我来说,看这本书最期望看到的是聚焦制造业大模型的痛点、难点和实际应用前景,对其进行严谨、务实的讨论。相关技术细节、行业洞察,这些才是最有价值的东西,什么都要塞进去,不会就此让读者认为作者是个全才,反而使得整本书显得臃肿、缺少亮点、重点。

制造业大模型,或者说更广层次的AI4Industry

面向工业领域应用的大模型技术路线(总结自书中)

路线1 通用大模型微调

由一般的通用大模型运用专业领域的数据进行微调,可以分为改变原模型参数和不改变原模型参数两种

![[通用大模型微调方法分类.png]]

从企业的部署成本和训练成本来看,全量微调基本是不可行的,而其他几种微调方法的参数量就显著降低,但在训练成本可以接受的前提下,企业内部是否有相关人才,也是一个值得思考的问题。仔细思考这种业务需求,要么就是企业专门招人来做;要么就需要有做toB业务、提供垂直领域大模型部署、训练、微调解决方案的公司

路线2 RAG(Retrieval-Augmented Generation),检索增强生成

建立一个可以动态更新的数据库/知识库,并对其进行文本块划分,分词、编码,模型生成内容之前首先在知识库中基于经过分词、编码的输入特征,在知识库中搜索相似度比较高的文本块,然后将这些文本块和最初用户输入的问题一并作为大模型最终输入,生成回答的内容

RAG方案有一个明显的优点,回答支持追溯验证。在要求答案具备可追溯的来源以确保能验证其可信度的场景中,RAG系统支持用户回溯查找答案出处,从而增强了回答的可靠性。

两种路线的对比和评估

以我目前的理解和知识,无法判断这两种方式之一是否能够成为实际应用中工业领域大模型的主流。

但是,如果没有更实质性的技术层面上的突破,现阶段看来,我认为RAG会是比微调更好的方式,而不是像书中举的几个例子一样,由一些企业提供一个训练好的大模型,做一些玩具一样的智能、炒作工业大模型概念、靠擦边圈钱吸金。

按照我的理解,RAG不需要对大模型参数进行微调,而主要是由专家知识、企业内部文档等内容构建知识库并对其编码、词嵌入,这意味着企业能够以较低的成本实现大模型私有化“部署”应用(实际上对于这种情况,理论上已经不需要物理层面部署GPU,而是可以期望于未来进一步发展的AI领域的MaaS、PaaS模式企业,比如硅基流动,从它们获取通用大模型的API)

AI4CAD

回到最初我所关心、想要调研确认的AI辅助机械设计这个问题上来,考虑AI4CAD的可能性。

头部CAD软件的发展情况

我想先看看CAD相关企业在集成AI方面的成果,尤其是chatgpt这样的大语言模型。先来看看比较入门也非常广泛使用的3D建模软件Solidworks

这是solidworks官方的一个演讲视频,讲了机器学习和AI在SolidWorks中的体现和他们还未能实现的想法

AI and ML at SOLIDWORKS - 3DEXPERIENCE World 2024

里面提到的几个应用场景更多是原有功能的优化,如他们所说的,是AI for Design Assistance,而不是AI for generative Design

  • 图像渲染(对于复杂的2D、3D建模图纸,视图切换、模型几何变换都需要重新渲染图像,想象在15°的扇形内部有两三千根线条交错,每一次鼠标滚动缩放,都需要进行复杂的渲染,否则将无法逼真地还原微观的几何特征)
  • 智能化自动布线(计算几何问题,从规划算法到大模型智能优化求解)
  • 智能识别绘图操作(大模型实现高效模式识别,使得建模过程不再需要和原来那样严谨,具体地说,画圆不一定要画得很圆,在手势上简单做一个示意动作,由软件智能识别并绘制出相应的草图)

而对于CAD领域的AIGC,演讲者坦白地说了一句

while you can create something simple very quickly, we still have a long to go before you can create highly complex design

就目前来看,由AI完成高水平、复杂模型地建模并没有被实现。他们期望实现一个从图片创建参数化的CAD 3D模型的功能,并认为这个是game changer,而更复杂的由描述不够精确、定性的、无专家知识的用户的自然语言描述,生成相应的参数化模型,显然还要等待更久

专家知识的转化

当前的头部企业未必代表创新的最前沿。我想他们仅仅依靠现有对相关市场的实质性垄断,就足够过着悠闲日子了。在工业领域,严肃的AI应用和很多人的关系也还不大。

我们可以直接思考一个专用于CAD任务的工业大模型的可能性。如果按照RAG的路线去思考,则主要面临的问题是如何基于相关的专家知识构建知识库。

小结

首先必须问一个问题,当我们讨论面向工业应用的垂直领域大模型,我们期待的就是什么程度的智能? 我想至少是能做到过去不能做或者很难做的事情。

而书里面举的几个工业领域大模型应用的例子,都不能让人满意,基本是赶时髦、蹭热度的噱头(具体可见末尾附的书中举例的总结)。

如果用研产供销服(研发设计,生产过程,供应链管理,销售、服务)来划分制造业全生命周期的各个环节,那么目前所谓的工业大模型大多聚焦自生产过程以后的环节。

在书中,作者将工业大模型的应用场景分类总结如下:

  1. 排产(资源调度问题)
  2. 工艺优化
  3. 产品质检
  4. 设备运维

这个结果令人失望,因为这几个环节依靠过去的运筹算法、软件开发、生产线自动化数字化智能化等多方面的积累,不是也能做吗?甚至其效果、可靠性也许会比目前的大模型生成内容更好一些。

如果认为研发设计需要创造力、需要从0到1的突破、需要跳跃性的创新,并因此判定这个环节的任务不能够由AI完成,我认为是不合理的。事实上,设计研发本身并不是基于从0到1的,更何况相当一部分机械零件的设计主要是较典型的结构在不同任务需求的尺寸、细节的改变,这个设计过程应该是能够通过AI完成的。

但比较现实的问题的是,能够完成工业级别水平设计任务的制造业领域大模型,其可行性只是主观的判断而言,谁支持?谁愿意做?具体怎么做?都是需要进一步去落地的事情,背后的成本、人才、技术甚至是社会问题,不是空想能够解决的。

一些暂时性的结论

  1. 工业领域大模型采用RAG应该是有实力的企业的首选方案。其具备易于动态更新、保证数据安全和可规避模型本身部署成本等多方面的优点
  2. 现阶段没有可靠的工业领域大模型,基本只是炒作概念或者用大模型这个新瓶装旧酒。(也许真的有企业认为他们站在最前沿拥抱最先进的技术,如果真的是这样,那么整个行业真是太悲哀了,制造业注定只能被动等待相关技术逐渐发展成熟,然后被改变)
  3. 关于工业领域大模型的可能性,一种方案等待AI业内技术更新迭代至更高水平;另一种方案则是以现在的大模型技术路线尝试自行构建私域知识库和基于知识库的大模型应用。后者就目前而言似乎是没有开拓者的一条未知险路。

一些可以思考的问题

  • 成本问题

    企业部署成本问题以及它背后的市场需求

    像硅基流动这样的公司,可以提供线上的模型供使用,并且提供了AI 基础设施。未来企业的部署需求要么靠这种AI 基础设施提供方,要么依靠自己买卡部署集群,后者意味着大量优质传统制造业企业的巨大算力需求

    1. 企业自己部署/训练/推理
    2. 企业采用RAG方案,自己构建知识库,仅部署开源大模型用于推理生成内容
    3. 企业构建知识库,不在本地部署模型,依靠MaaS服务调用大模型
    4. (其他可能的方案)
      不同的解决方案的成本也不同
  • 大语言模型在某些工业应用上是否是大才小用?

    例如生产线上工业机器人的姿态识别、路径规划。大模型对于工业领域的企业的意义,可能在于通用泛化和用人成本,在无法吸引到AI领域一流人才对不同问题准备针对性方案的情况下,依靠大模型,可以对一般的问题快速得到解决。但这也意味着专门为某一个企业准备一个大模型可能是没必要的,且企业本身也不一定有这个需求。

  • 关于专门提供工业大模型构建服务的新企业或者新人才岗位的可能?

  • 有条件可以注册申请中工互联智工大模型,试试究竟有几分真干货

附:书中提到的工业领域大模型应用案例

具体案例

海尔卡奥斯:COSMO-GPT

在某洗衣机工厂,只需一张CAD图,COSMO-GPT就能自主识别所有所需工艺流程,并完成对装配机器人等所需设备的控制指令编写,高精度、高效率地完成洗衣机的智能柔性装配工作,全程无须人为干预

10.2.2 节更加具体地介绍了海尔的例子

洗衣机的注塑工序(模具开合,涉及温度、压力、成型周期、模具健康、能耗等因素)

科大讯飞:羚羊工业大模型

具有工业文本生成、工业知识问答、工业理解计算、工业代码生成、工业多模态五大核心能力

中工互联:智工·工业大模型

工艺流程、故障诊断等专业领域经验,被提炼并注入模型中,使之能为人工操作提供智能辅助和决策支持。如此一来,繁复的工作会由大模型“代劳”​,工艺工人的劳动强度将得以减轻,人机协作效率大幅提升

宁德核电:锦书核工业大模型

宁德核电有限公司发布了全球最大参数量的核工业大模型,引领着新能源智能化浪潮。基于锦书核工业大模型,宁德核电开发出国内首个核工业大语言模型应用平台“云中锦书”​。该平台部署了基于系统化培训理念的智能培训系统、个人岗位晋升系统、PPT生成等多个应用,实现企业降本提质增效的目的

思谋科技:IndustryGPT V1.0

案例评估

海尔的例子初看是最惊艳我的,相比之下讯飞的例子感觉是欲盖弥彰、语焉不详,如果有真才实料为什么不说具体能做什么场景;宁德核电,基本上是擦边“工业大模型”,岗位晋升系统、PPT这两件事本身就是无意义的,无非是制造垃圾更加容易了

中工互联看上去勉强还行,但是仔细探究一下确实大跌眼镜。想要试用智工大模型,首先需要注册,而其注册通道上输入身份证一栏尽然不考虑身份证最后一位为X的情况,不管是PC端网页还是微信小程序的注册通道都是如此

查询相关新闻报道,比较实际的一个应用案例是智工·工业大模型×DeepSeek赋能污水处理,可以看到

智工·知语使技术专家与AI助手能够实现流畅的交流。无论是查看数据、调整参数,还是查询设备状态,都可以通过语音或文字指令快速完成,极大地提升了操作效率和便捷性。

基于AI-SCADA(智工·智控)技术,能够实时监控污水厂的各项运行指标,自动采集并分析设备数据,发现潜在的故障隐患。通过智能算法,AI-SCADA能够提前预测设备的运行状态,提供预警和优化建议,确保设备在最佳状态下运行。

智工·智脑作为AI助手的“大脑”,通过深度学习和大数据分析技术,帮助厂长们实现数据的深度挖掘和决策支持。它能够分析污水处理的历史数据和实时数据,为厂长提供智能化的决策建议,帮助他们制定科学的管理策略。

将智工大模型和deepseek绑在一起已经很不得不让人怀疑了,而做的事情也不过是高水平自动化而已,依靠语言交互实现查看数据、设备状态,不依靠llm也能做,设备故障监测如果能够做到多模态、高准确率,那么是有意义的,否则使用机器学习做故障检测可以说是灌水论文的重灾区,相关方法满天飞,也不需要专门调用大模型去做。分析污水数据提供决策建议,有点AI Agent的味道,至于什么效果、生成什么样的结果、对人的依赖程度有多大,无从得知

那么对于海尔这个例子,具体来看看它背后究竟几斤几两。

仔细一想这个应用场景,洗衣机生产,书中提到关键挑战在于注塑工序(应该是洗衣机滚筒部分),而这个工序基本上可以是看作标准化的,对于基本结构不变的洗衣机产品,不同的CAD图纸之间的差异可以归纳为尺寸、材料等核心参数的不同,那么整个智能化生产的过程基本可以拆解为

  1. 分析图纸,确定关键的参数的取值
  2. 对应到生产各道工序,相关设备的参数设置
  3. 由期望的设备参数设置情况和工序,由数控加工设备或者工业机器人/机械臂完成相关操作

按照上述分析,大模型只需要能够完成从CAD图纸分析出相关参数信息,然后与一个标准化的模板对齐,指定固定的几个参数的取值,然后整个生产过程就能够在相关企业原有的足够高水平的自动化生产线上完成。而分析CAD图纸本身我觉得是完全可行的,说难听点,如果在画图纸环节做一些标准的限制、约定,那么这个分析环节依靠CAD软件扩展程序开发实现是绝对能够做到的,当然这个批判是建立在默认只生产单一产品(洗衣机)的假设上,但这个例子里面所呈现的也没有比洗衣机生产更广泛的应用场景。

发表评论

您必须 [ 登录 ] 才能发表留言!

相关文章