汽车行业是最先享受智能制造红利的高端制造业之一,其中,新能源汽车在双碳背景下增长势头尤为强劲。据国家统计局数据,2023年我国新能源产销分别完成958.7万辆和949.5万辆,在整体年度市场中占比达到31.6%,同比增长速度达到37.9%。
广袤的前景、飚速的增长,也让新能源车厂走在了智能制造前列。四年前,数据要素被正式列为新型生产要素,如今,它已成为组成智能制造、守护安全生产的要塞之地。汽车相较于一般制造业,有着一套更严苛、更精密的标准,而车规级的数据安全也需要更加更高级别的冗余与容错来防护。在位于深圳的国内某知名新能源汽车主机厂,正携手研华开展一场新能源汽车的“数据保卫战”。
停产、宕机、断线,汽车生产之痛知多少
我们知道工业数据的特殊性就在于它与生产现场息息相关:时序性、准确性、闭环性……牵一发而动全身,软件和系统如果突发停滞、宕机、数据丢失等故障,带来的非计划停机直接影响着实际产量、交付周期、产品质量等等,而这些对于有着高标准、严要求、准交付的汽车行业而言,是要坚决杜绝的。
在汽车“新四化”竞争下,汽车芯片国产化的也逐渐成为主机厂们护城河的一部分。其中,存储芯片作为汽车主机部分的核心部件之一,在使用中扮演着保存汽车各系统数据和行使状态的重要作用,也支撑着网联化、智能化、共享化等丰富的应用范式。车规级芯片的生产线,当然要“车规级安全”来守护。在该新能源车厂的Flash存储芯片生产线上,需要一套稳定的工业级容错系统。作为汽车主机厂的核心生产线,对容错服务器伙伴的选择慎之又慎。它需要在主服务器发生故障时,能够快速承接过来所有数据和应用,确保数据不丢失,关键任务照常进行。研华Always-On 工业级容错服务器解决方案成为了工业物联网产线的理想选择。
研华容错系统基于两组冗余的硬件模组,通过对虚拟机的CPU状态、内存数据、磁盘数据的实时同步,保障了兄余单元双活同步运行。当主机节点发生硬件故障时,业务可无缝切换至备机节点,磁盘和内存数据不丢失,业务持续不间断运行。高可靠工业级平台确保关键数据99.999%安全保护。
据项目负责人介绍,这条Flash存储芯片生产线从生产出来到集成主机、到汽车装配出厂以及消费者使用,每一颗芯片要履行很长的生命周期,因此车厂就需要将芯片的生产过程数据进行收录,这是芯片出厂前的质量管理必要步骤,也是未来2-3年甚至更长时间质量追溯的来源。从这个角度来说,该芯片产线上任何一个关键应用的“差之毫厘”,都可能为以后汽车追溯的“失之千里”埋下隐患。为了满足车规级数据链的完整性,研华的容错服务器解决方案在技术精度下足功夫:秒级切换、完整备份、异地保护。
秒级切换,零中断感
如上文所说,研华容错服务器基于对产线设备实时的监测工作,为现场织就了一张平行于主服务器的“保险网”。研华单台服务器可控制100多台设备,在容错模式下,当故障一旦发生,触发容错引擎,备用服务器可在一秒内接管主服务器上所有的重要应用,保证了任务的连续性,对使用者来说几乎完全没有“中断感”。
事实上,该车厂对网络延时的耐受值的要求是不超过30毫秒,而研华容错服务器部署后实际延时约在20毫秒左右,远远超出业内平均水平,达成了该产线实现极致容错的期望。
-完整备份,一键修复
秒级接管的硬实力意味着更少的数据丢失,这对故障前后完整数据链的修复工作大有裨益。汽车芯片生产对数据连续性的要求颇高,如何让备份服务器迁回主服务器后达到近乎“无痕修复”?研华负责人介绍道,相比较传统的双机热备技术,研华容错方案对各级数据的保存都进行了升级。例如,传统冗余只能保护到磁盘/硬盘中的数据,而研华可以保护到保全到内存的运行数据,这将是复原某项重要应用的数据连续性的关键,而容错级别的精益求精才能更好地满足了汽车芯片生产的合规性。
-异地部署,分摊风险
此外,为了保证“灾备”工程自身的安全,研华还考虑到主、备服务器因突发事件同时受到影响的极端情况,例如地震、供电不稳导致的局部大范围断电/断网。对此,研华容错服务器还支持两台服务器异地部署一公里范围内,通过光纤直连的方式将小概率风险因素进行物理隔离,进一步保证了灾备工程的高可用性。
提质-降本-增效,为产线节能增效提供安全数据保护!
在大型的数字化项目的考量上,除了技术能力,企业最看重的还有综合成本。所谓综合成本,就是与随着容错服务器方案投入的前期上线成本以及后续维护一系列人力物力的投入。
在传统的双机热备方案,企业需要在主、备两台服务器上分别装载热备软件和操作系统,因此传统的集群方式也需要多一份软件授权的年费。研华方案通过底层虚拟化技术将主备服务器连接,并支持在此之上部署多个操作系统(Windows/Linux),因此软件授权以及操作系统授权也都需要一套,长期来看研华的容错方案可帮助客户实现技术降本:显性层面,直降近半的软件授权成本;细究来看,因多操作系统耦合/切换而衍生的一系列软件层bug、设备故障也将免除。
另一项成本需要划分给运维阶段。该车厂对服务器运维的响应度的要求很高,否则一旦备用服务器不在线+主服务器故障同时发生,整个容错工程就等于白忙一场。研华三管齐下,从方案设计底层虚拟防护+1h技术响应+12h现场响应,来保障整个容错服务器的高质量运维。强大的在地化服务团队急客户之所急,打造“车规级”标杆速度。
目前研华与该车厂的容错服务器项目已交付两期,在投入使用近一年的时间里,客户实际生产的故障停机时间大大缩短,显著提升了芯片全流程生产的数据质量,降低了软件侧与运维侧的综合成本,为整个车厂转型升级打好了提质、降本、增效的结实基础。接下来,双方将继续扩大合作规模,并与更多行业客户、集成商伙伴一道持续探索新能源汽车的安全生产议题,以领先的容错技术助推我国新能源汽车驶入高质量、高可靠的高速路段。
发表评论