本文旨在从工业大数据的特点出发,阐明工业大数据的来源与采集方式,分析并总结工业大数据在工业互联网环境下的应用。最后,为工业大数据助力制造业数字化发展提出建议。
工业大数据的特点
与商业领域关注数据之间的关联性以及对数据具有较高容错率的特征相比,工业领域的大数据更为重视数据特征蕴含的物理意义以及特征之间的关联机理,对分析结果的可靠性要求较高。工业大数据具有规模大、速度快、类型杂、质量低的“4V”特征,还具有反应工业机理与逻辑的多模态、强关联、高通量、因果性、价值性等新特征。
工业大数据要反映工业系统各方面的要素,强调数据样本的全体性。记录全体数据不仅要包含工业软件及系统中的结构化数据,还涉及不同专业的视频、图纸等半结构化、非结构化数据,导致数据文件结构复杂和数据内生结构的多模态特征。工业大数据的强关联体现在工业系统中不同物理对象与过程的语义关联,反映了工业系统复杂的动态关系,体现出了产品生命周期内设计、生产、运营、售后等各过程的不同专业数据之间的关联。高通量是指设备与产品利用传感器能够短时间内采集大量时间序列数据,这类时间序列数据呈现出吞吐量大、产生速度快并且持续不断的特征。工业大数据的价值性体现在其应用能够解决企业生产制造过程中的痛点问题,帮助制造企业实现数字化转型。工业大数据的因果性体现在通过数据分析得出可靠的结论和知识,用以指导工业系统运行的过程。在工业大数据分析应用过程中追求因果性能够降低不确定性导致的损失。
工业大数据来源
工业大数据作为工业互联网的核心要素和生产资源,让人与机器的对话成为可能,是企业从“制造”到“智造”转型的加速器。从业务视角出发,工业大数据主要来源于企业信息化数据、工业物联网数据和外部跨界数据。
企业信息化数据是指存储在进行日常生产与管理活动的ERP、MES、SCM、CRM 等信息系统中的高价值业务数据,涉及产品生命周期各个环节,这部分数据已成为工业领域传统的数据资产。
工业物联网数据是指通过传感器等连接机器、产品对象等产生的数据。主要分为生产现场的数据以及交付客户后的终端产品数据,是工业大数据的重要组成部分。
企业生产运行不仅受内部生产要素的影响,政策法规、宏观经济数据、市场变化等外部要素也会影响企业的生产和产品创新。由于工业系统处于复杂多变的内外部环境之中,外部跨界数据也是工业大数据的重要来源。
工业大数据采集
工业大数据采集是制造企业数字化转型的前提。工业互联网在助力企业转型升级过程中,成为工业大数据采集和应用的新载体。其边缘层通过接口、协议或系统集成的方式完成对不同来源数据的接入与实时采集。
工业互联网利用数据接口连接企业信息系统,支持ERP、CRM、MES 等应用系统数据的批量或增量导入,实现异构系统中数据的统一管理。
工业物联网数据采集主要包括工业现场数据采集和工业产品数据采集。工业现场的数据采集针对现场工业控制系统和设备进行。通过生产现场的自动化与控制系统,如 DCS、SCADA 系统等,借助传感器、采集器、射频识别等实现对地理位置集中的底层设备或分散的工业现场设备进行监视与数据采集。工业产品数据在产品或装备在客户端投入使用后,通过 4G、5G、NB-IoT 等无线通信技术接入工业互联网,利用标识、传感器等获取产品信息、能耗、温度、工作电流、电压等实时指标数据,完成数据的采集。
企业决策不仅受自身资源、管理条件的约束,还受外部环境的影响。借助数据抓取技术等从市场、合作伙伴或竞争者等处获得外部跨界数据,包括从市场动态数据中提取的消费者对产品的满意度和未来需求的相关数据、合作伙伴或者竞争者的动态发展数据等。
工业大数据的分析与应用贯穿制造企业生产经营的全过程。工业大数据在研发设计、生产制造、远程运维、数字化运营管理等方面帮助制造企业实现了降本增效与提质增收。
研发设计
数字经济时代,市场竞争环境复杂多变,高效率地进行工业产品设计是缩短交付周期、提升企业竞争力的前提。工业大数据支持产品协同设计、智能装备的数字化设计以及建模仿真等。如在航天云网的支持下,依托数据和模型实现了航天企业产品的协同设计和多学科建模仿真 。通过工业互联网技术感知多维数据,利用半监督学习和朴素贝叶斯分类器处理工业数据进行关键词提取、情感分析、语义关联,实现智能设备数字化设计。利用模糊逻辑、神经网络、遗传算法、物理规划等计算智能技术进行概念设计方案的选择与评估,帮助设计人员快速找到坦克发动机的最佳设计方案。除此之外,应用回归、聚类和关联规则等常见的数据挖掘方法能够辅助产品设计与性能优化,缩短产品开发周期。
生产制造
企业依托工业互联网采集生产过程的工业大数据,在生产工艺参数优化、能耗管理、质量管控、生产调度、智能排产、生产监控等场景实现了工业大数据的深度应用。其中,算法和模型是工业大数据发挥价值的重要手段。
(1)生产工艺参数优化
工业大数据的应用改变了企业依赖工人经验或大量实验来调整与优化生产工艺参数的现状。借助工业互联网整合的产品全生命周期历史数据,利用数据分析算法与模型,提高生产阶段工艺参数设置的准确性。例如,卷烟包装公司利用数据分类规则提取卷烟包装的工艺参数,通过关联挖掘确定工艺参数之间的内在联系,从而发现工艺参数设置的最佳组合,实现工艺参数的优化。在高铁弹条生产环节的热处理工艺中,通过工业互联网实时获取工艺参数信息,利用 BP神经网络模型预测和优化后续工艺参数,这一方法提升了高铁弹条的质量与性能。
(2)能耗管理
能耗管理是工业大数据的典型应用场景之一。数据驱动的能耗管理能够在一定程度上解决生产过程中能耗浪费的问题,使能耗管理变得更加透明,实现了能源的节约和高效利用。如部署具有云计算功能的能源管理系统是实现能源消耗控制与优化的一种有效手段。增材制造行业的生产活动伴随大量的能源消耗,利用基于聚类的深度学习算法对增材制造过程的多源数据进行集成与建模,实现增材制造系统能量消耗的准确预测,帮助企业更好地完成能耗管理工作。除了以上方法,运用回归、分类、神经网络、遗传网络、时间序列、空间解析等智能算法或模型分析生产现场的能耗数据,识别与能耗变化高度相关的关键参数,进而实现产品生产制造过程的能耗管理与优化。
(3)质量管控
制造企业的发展前景很大程度上取决于产品质量,而应用工业大数据能对产品质量进行适时的控制、调整和提升,从而更好地满足客户要求。例如,富桂公司以质量管控为中心,融合新兴技术打造工业互联网平台,针对设备内部数据、生产线生产数据进行数据集成与分析,控制产品质量。另外,在采集生产线质量数据的基础上,通过结合生产计划与用户需求构建质量智能管控模型。钢铁企业实现了产品质量的主动在线管控,不仅降低了工人的劳动强度,还能有效控制产品质量。
(4)生产调度
受工业互联网等新兴技术的影响,生产调度系统正在向智能调度系统转变。在工厂安装智能传感器和监控设备,进行生产现场的数据采集、关联分析与融合处理,实现实时智能生产调度。智能生产调度常用的算法模型包括决策树、遗传算法以及聚类分析等。例如,针对 Job Shop 调度问题,构建决策树模型分析海量生产数据,获取数据驱动的调度规则,对机器的使用进行调整,提高车间生产效率 ;结合混合整数规划、离散事件模拟和遗传算法能解决传统调度方法在应对指数级数据的处理以及环境的动态干扰方面存在的不足,实现综合调度,提高企业运行效率。
此外,工业互联网对生产数据的全面感知、实时分析,支撑着企业实现智能排产与生产监控等活动。在产能约束和交期约束等条件限制下,可以利用神经网络、深度学习等算法模型处理生产数据,制定企业最优的排产计划。基于工业互联网的生产监控系统运用大数据技术处理生产现场的数据流,监控车间的整体生产。数据驱动与算法模型的融合应用,能够对生产做出及时调整与反馈,在提升制造企业生产效率的同时,降低生产成本与风险。
远程运维
制造业的发展依赖于大型装备与关键设备,其健康运行对工业企业的正常运转至关重要,而工业互联网广连接、速度快、低延时的特点加速了远程运维服务的发展。利用统计技术和机器学习方法,如决策树、K-means、贝叶斯算法、关联规则、神经网络、支持向量机、红外图谱诊断算法等智能分析算法,结合基于图谱的识别技术,分析产品运行的时序数据,能够识别设备异常状况下的影响因素。利用工业互联网实现设备故障诊断与预测性维护,降低了工人运维工作的强度,通过设备运行实时状态监测、自动预警和故障诊断维护,实现了对机器的安全运营,提高了设备可用率,推动了设备运维智能化发展。
(1)设备故障诊断
对设备的实时监测有助于企业掌握设备的运行状态,快速诊断设备的运行故障。过去,对于设备故障诊断首选的衡量指标是检测平均运行长度和平均信号时间,但通过统计得到的运行状态参考结果具有局限性。工业大数据的应用打破了这种局限,能基于机器的实时状态进行准确的故障诊断与预测。
利用无线传感器网络和射频识别技术,可以实时采集不同来源的设备监测数据,结合支持向量机、深度神经网络等机器学习算法和模型对数据进行分析,帮助企业做出准确的故障预测和诊断。例如,基于动态增量主成分分析进行故障原因检测后,再利用卷积神经网络识别故障类型,能有针对性地实现工业电机的实时故障诊断。
(2)预测性维护
预测性维护通过利用工业大数据和机器学习算法建立预测模型,在设备运行状态监测和退化机理经验的基础上,尽早发现故障隐患和预测设备剩余寿命,尽可能延长设备的使用时间。例如,通过使用自组织映射和高斯混合模型等无监督学习算法对不同工作制度的机器数据进行分类,针对不同类型的机器数据构建预测性维修模型,从而做出维修决策,降低机器意外停工给企业带来的成本。应用退化模型和贝叶斯方法对传感数据进行分析,实现工业互联网环境下基于事件驱动的机床状态监测和剩余寿命预测,根据剩余寿命合理安排工件生产任务,实现企业效益最大化。除了这些模型或算法,基于聚类、神经网络、支持向量机和随机森林等算法构建预测模型,及时准确地预测设备可能发生的故障,从而提高设备可用率,降低停机维修造成的损失,使设备在保障安全的前提下能够合理超期服役。
运营管理
在客户需求多样且复杂的环境下,工业大数据的应用使企业数字化运营成为可能。工业大数据通过遗传算法、神经网络、关联规则、支持向量机、时间序列预测等智能算法或模型,帮助企业在供应链弹性优化与协同、需求预测等场景下实现数字化运营。
(1)供应链弹性优化
工业互联网高度集成供应链上下游产生的海量数据,实现企业之间的连通与协同。利用算法和模型分析供应链的数据能辅助管理者做出及时准确的决策,实现供应链的高效运营、优化与智能升级。供应链运行过程中可能因不确定情况发生中断,利用数据驱动的方法分析破坏性历史事件数据,将分析过程与稳健优化框架相结合形成的双目标两阶段自适应鲁棒分式规划模型是内生不确定性条件下的供应链弹性优化的一种有效方法。在按订单生产时,供应链存在各种动态波动,具有冗余的库存、产能和运营能力,因此,优化供应链的弹性对于提升供应链的产能与运行效益至关重要。
(2)需求预测
在激烈的市场竞争环境下尽可能准确地预测客户需求是企业开展采购、生产、库存等日常活动的前提与基础。通过对能源序列数据进行频繁挖掘和 K-Means 聚类,分析家电与家电、家电与时间的关联导致的行为消耗模式,反应消费者的预期舒适度,辅助公共事业单位提前计划与平衡能源的供应与需求。基于并行神经网络的新型机器学习算法,用于鲁棒检测和电力需求的预测。
该算法增强了能源监控与数据采集的能力,是电力行业在工业互联网背景下实现服务化的一种稳健预测方法。工业互联网环境下工业大数据还被应用到制造企业的库存优化、配送优化、精准营销、金融服务、客户关系管理等运营场景中。例如,终端产品通过加装传感器实现基于物联网的产品追溯,通过大数据分析,制造企业可以了解用户位置分布和客户需求,使精准营销、库存与配送的优化成为可能。制造企业在进行客户关系管理时,引入分类或聚类算法,根据客户历史数据进行客户群细分,以便进行交叉营销和潜在客户的挖掘,主动服务客户,提高企业运营效率。工业互联网也成为金融机构与中小微企业对接的渠道与中介,通过数据分析助力金融机构准确评估信贷风险,建立中小微企业的信用评级体系,改善中小微企业融资难的现状。
数字经济的发展带来了工业数据的指数级增长。工业互联网的发展尚处于起步阶段,为工业大数据的应用提供了广泛的基础和广阔的空间。工业大数据的应用在制造企业转型升级过程中能够带来巨大的经济效益。工业大数据驱动应用的过程需要进一步深入探索。建议从以下方面深化工业大数据的利用,更好地发挥工业大数据的价值。
(1)建立大数据共享生态,实现数据资源的协同发展。互联互通和开放共享对于数据的高效流通与利用至关重要。作为数据载体的工业互联网统一工业数据和算法模型等调用接口标准,利用标识打造数据共享机制,基于区块链建立数据安全机制和信任体系,从而促进大数据的开放共享。
(2)通过产学研协同加强大数据技术成果落地应用。制造企业、高校、科研单位紧密协同开展算法模型等创新研究,为制造企业培养工业领域的大数据技术人才,推动工业大数据技术成果的创新与落地应用。
(3)拓展工业互联网环境下工业大数据的应用场景。工业互联网作为新兴产物,给制造业带来了众多发展机遇。深化工业大数据在设计阶段用户参与、工艺设计,生产阶段的任务协同、闲置资源租赁,运营阶段的产销量预测、自动化库存、成本管理、风险评估,增值服务等场景的应用,更好地促进企业数字化转型。