长亭百川云 - 文章详情

25年奇幻漂流,一群人正把中国制造业的数据带回故乡

浅黑科技

49

2024-07-13

浅友们好~我是史中,我的日常生活是开撩五湖四海的科技大牛,我会尝试各种姿势,把他们的无边脑洞和温情故事讲给你听。如果你想和我做朋友,不妨加微信(shizhongmax)。

25年奇幻漂流

一群人正把中国制造业的数据带回故乡

文 | 史中

(一)铸剑师和“数据远征军”

说起1997年,很多人心里都会浮现出一些照片,它们有些许褪色,却鲜活柔软。

那一年,有些小事,戴安娜王妃逝世,深蓝战胜卡斯帕罗夫,人们涌进电影院看了《泰坦尼克号》。

那一年,也有些大事,香港回归,三峡截流,中国“入世”进入了谈判攻坚——一个经历风霜重新振作的大国,决定敞开劳动力和市场,用发展中国家的谦卑,拥抱来自全世界的产业。

1997 北京

那一年,张金银还不叫**“行在”**,而是刚走出大学校门的“小张”。

小张进入一家外企,成为了人人羡慕的“别人家的孩子”,也成为了那个时代的一场绝佳隐喻。

为了利用中国便宜的生产力和广阔的市场,这家外企一口气建了20多座工厂。而小张的岗位很有意思,表面上叫“IT系统开发工程师”,但本质上他是个**“铸剑师”**。

铸啥剑嘞?

1、工厂从原料采购,到仓储,到生产,到库存,到销售,到财务,到员工管理,整个流程极其繁琐,每一步都需要专门的系统。但仔细一瞧,各个系统里都含有同一种东西——数据。

2、数据就像铁矿。它们躺在各个系统里,现实世界里工厂从进货到生产到销售的流程走完一遍,公司账上的钱就多一些,这些铁矿也会增加一些。

散落的铁矿没啥大用,但如果把这些铁矿收集起来,再冶炼锻造成一把剑(数据报表),那用处就大了!!

3、企业老板手握这把“重剑”,在办公室里抽着雪茄喝着威士忌就能发现经营中的蛛丝马迹,然后“长袖舞剑”——优化人员、调整工资、调整进货、库存、生产节奏,然后赚更多的钱!

怎么样?这个“数据铸剑师”的工作还挺重要的吧?

话说仅仅过了几年,大家就不好意思再叫他小张,因为他从“铸剑师”变成了“铸剑大师”:

为了管理好这些“矿”,大师升级了美国的 Oracle 数据库,让数据像温顺的羔羊各安其位,不错不漏;

为了把“剑”铸造得更锋利,大师还引入了德国的 SAP 数据仓库,让数据之间能联合计算,老板关心啥指标,它就能算啥指标。

这些数据应用组合起来,就像十八般兵刃,把竞争对手打得满地找牙。

最牛的时候,全国20多个工厂,几十个数据库,都在小张手下——无论出啥问题他都能修。

有一次数据库出故障,机房里所有领导在他后面站成一排,眼巴巴地看着这位“大神”,公司的身家性命妥妥地都系在他一个人身上。。。

怎么样,风光不风光?

对于一个刚毕业几年的技术人来说,那绝对是巅峰体验呀!但对一个国家的来说,这。。。何尝不是个有点尴尬的瞬间?

仔细想想看:

虽然整个生产销售过程都发生在中国境内,但生产线是国外进口的,经营过程产生的数据是外企的,存放数据的数据库是外国的,计算数据的数仓也是外国的,赚来的利润是外企的。

小张吭哧瘪肚铸了半天剑,最后跟中国人好像没啥关系。

跟中国人有关的,满打满算就两件事:第一,在产线上“打螺丝”赚取微薄的薪水;第二,用这些可怜的工资再把自己做的产品买回去。。。

你看,那个被无数人怀恋的1997,其实也并没那么温柔缱绻,细想起来挺憋屈。

可话说回来,谁让中国制造业又没产线又没技术又没人才呢?这事儿咱得认。

认,没问题,怕的是一直认,认到天荒地老。

新世纪黎明在前,中国大地暗潮涌动,有好几支“不认命”的队伍已经趁着熹微整装出发。

其中最为人熟知的一支队伍,当然是中国的制造业企业家。

他们大多地处广东或江浙,从最落后的生产线开始引进,从技术含量最低的鞋袜、小黄鸭、圣诞树做起,背负着“中国制造=劣质产品”的嘲讽,开始了孤独而漫长的远行。

他们的目的只有一个——有朝一日,要把全球制造业的主导权拿回中国。

而几乎在同时,另外一支神秘的队伍也已开跋,那就是“数据远征军”。

数据远征军们相信:

中国制造业如果想登峰造极,绝不能只靠绞动的齿轮、炽热的火焰和一眼望不到头的工人们用自己的生命年华去冲锋。

有朝一日,当制造业的权柄捏在中国人手中之后,蕴含在制造业躯体里的“数据铁矿”和以此锻造的“数据武器”也都要掌握在中国人手中。

张金银,就是这支数据远征军的一员。

2004年,他一个猛子跳进了奔涌的互联网大潮,加入阿里巴巴,换上了“行在”这个花名。

他和一群老师傅一起摸着石头过河,最终帮阿里造出一套全球最先进的、中国人完全理解和掌控的数据平台。

这一战,不仅成就了阿里巴巴鼎盛的“DT 时代”,也成就了“行在”在数据智能领域的赫赫威名。

2016年,行在突然从阿里巴巴离开。

最初看到这个消息时,我表示反对。

因为在互联网行业,数据之剑的“法力”刚开始显现,当时的阿里就像一个“道场”,还有一万种剑法等待老师傅研习,为啥非要在意兴正浓时跳出聚光灯圈?

行在(张金银)

当然命运的蜿蜒很难用一两句话解释,但如果我们曾站在1997年的“小张”身边,恐怕就能对他后来的选择多一些感同身受:

行在虽然把人生最好的12年贡献给了互联网,但他却并没有对互联网“献身”的执念。

别忘了他不仅仅是互联网人,更是那个从世纪之初就出发的**“数据远征军”**的一员。

2016年,行在跟一群小伙伴郑重地创立了奇点云,他们的目标是:

1)作为中立的第三方;

2)站在所有行业身旁;

3)用中国人自己的技术平台;

4)帮助他们把“数据”这把利剑牢牢握在自己手中,披荆斩棘,打怪升级。

(有关这个故事,我写在了《14亿人的生活琐事,正在变成永不枯竭的石油》中,感兴趣的盆友可以去复习)

说到这儿,奇怪的事情来了:

在那之后将近五年的时间里,奇点云做得风生水起,用“数据智能”的剑法敲开了零售业、金融业,甚至诸多政府央企的大门,却偏偏一直在绕开整个故事的起点——制造业

这是为啥?!因为不乐意么?!

在我看来,“制造业”和“数据智能”其实就像一本厚厚小说里的男女主人公,虽然读者都猜测他们最终会在一起,可在那之前,他们却得铆足了劲儿先演绎一些波澜壮阔又相爱相杀的故事。

而就在这些故事中,有关我们国家和每个平凡人的命运肌理,也悄然浮现。

(二)制造业家里突然有了矿 

要讲清楚制造业的故事,你得容我先来一波硬核科普——数据第一性原理。

你有没有曾经像我一样,突然懵住,然后灵魂发问:

数据说到底不就是一堆数字么,它们为什么会成为有价值的“矿”?我小时候做了那么多数学题,现在不还穷得每天舔酸奶盖么?‍

如果是一堆编造的数字, 游泳池一边抽水一边放水之类的,跟我们的生产生活没有关系,那确实毫无价值;但如果一组数据真实描绘了现实世界的某个过程,它就有价值。

这里的动力学过程是:

1)一旦一组数据描绘了世界,人们就有办法从中找到规律,从而预测未来的走向;

2)对未来预测得越准,就可以越早、越坚定地采取行动;

3)我行动比别人快,我就赢了;我行动了,其他人没行动,我就赢。麻。了。

注意,后文我所说的一切数据的玩法,本质上都可以追溯回这个数据第一性原理。到时我就不一一提醒了↓↓↓

从这个原理出发,我们再看一下数据技术的进化历程,就会非常清晰:

25年前(行在还是“小张”时),数据虽然可以被铸成利剑,但舞剑的仍然是人。

从数据里分析出规律的是专家,利用这个规律做出行动的是老板。

这个时代,就是“IT 时代”。

10年前(行在成为“行在”时),数据被铸成利剑后,舞剑的有两个:人+智能系统。

而且,智能系统做出的决策越来越多,人做出的决策越来越少。

这个时代,就是“DT 时代”。

问题来了:人做决策不是挺好么?为啥要交给智能系统?

还真不是人想偷懒,这里有个关键因素:数据量。

即便在今天,人脑仍然是地球上最精密的计算系统。但说到底人脑只有二两肉,如果数据量小,人脑的分析能力完胜智能系统;

如果数据量超过一个临界值,那么人脑就会爆仓,必须丢弃一些信息之后才能继续思考,这时智能系统的分析能力就会迅速高于人脑。数据量越大,差距就越悬殊。

这个临界值,就是“奇点”。

所以,任何一个行业,想要进入“DT 时代”,一个先决条件就是:拥有大量的“数据铁矿”,这个量一定要大到超过那个“奇点”。

好了,本期浅黑小课堂结束。

有了这些铺垫,接下来的故事就非常好理解了。

如果回顾历史:

互联网行业越过“奇点”,大概是在2012-2014年,而后才有了 BAT 的一骑绝尘;

零售业和金融业越过奇点,大概是2014-2016年,而后才成就了各种“超市外卖送货到家”和“手机上的金融服务”。

你有没有发现,这些行业之所以跨过数据奇点,是因为它们“家里有矿”——天然和个人消费者比较靠近,人产生的数据很多,也“狠”有价值。

可是,制造业。。。就和那些“富二代”比不了了。。。

制造业的上游是原料,下游是经销商,都不是个人,天然就没那么多数据给你折腾。

所以,制造业虽然很重视数据,也很早就进入了IT时代,但是它的数据量一直没有暴涨超过临界点,所以一直“趴”在IT时代。。。

直到2020年。

冥冥中传出“咔嗒”一声,一个微小的,维持了几十年的天平悄然倾斜,撞倒了第一张多米诺骨牌。

那年疫情来袭,各行各业居家办公,对快递外卖的需求暴涨,与此同时很多工厂停工,赋闲的工人们转而成为外卖员。

大量产业人口快速转移,像一个急浪,让本来就稳步上涨的工人工资出现急速抬升,迎头撞上了因为国家政策鼓励和技术进步而迅速下降的机器人成本。

于是,一些原本还犹豫一下是“让人干”还是“让机器人干”的事情,从那一刻起,已经可以毫不犹豫地交给机器人来干。

这里尤其要说说“精密制造业”。

工序越是精密,人来干的失误率就越高,机器人相比人类的优势就越大,机器人化的浪潮就越快。

于是在2020,电子制造、光伏、电池、半导体、医药等等领域,无数机械臂、自动运料车、一体化产线被一股脑送进了大小厂区。

这一刻起,后面的波澜壮阔已经无人能挡。

你可能还在纳闷,机器人和数据有啥关系嘞?

别忘了,这些机器人可都是物联网(IoT)设备,它们在工作时,不仅能实时记录“手中产品”的状态,也能时刻记录“自己”的状态。

这些状态都是数据,而且是真实描绘现实的数据。工厂24小时不休不眠,数据就24小时不间断地产生!

这是啥?这是矿啊!

从天空俯瞰,2020疫情的肃杀之下,精密制造业的数据却如寒武纪一样炸裂,一下子冲过“奇点”,加入了“家里有矿”的行列。

彼时普通中国人的注意力200%都被疫情死死吸引,自然对这一切懵然无知。

但有一些人却嗅到了这个千载难逢的机会,那就是一直站在奇点旁边的人——行在和奇点云的数据铸剑师们。

这不,2020年,小区刚刚解封,行在就亲自出马,坐在一家全国知名的电子制造企业的办公室里。为了行文方便,我们就叫它A企业吧。

A企业的数据总监提出的要求很明确:“最近我们的数据量突然变多了,原来一分钟就能算出来的报表,现在都得十几分钟才能算出来,你们能不能把底层数仓系统改造一下,让我们算数快点?”

行在听了,哈哈一笑:“你这要求是‘基本款’,我们肯定能做到!其实咱们还能进一步。。。”

他向前探探身子,“如果把各个系统的数据打通以后,我们还能自动预测每笔订单的交货时间,帮助你们更好地排产,更快地交货,这个功能你们想要吗?”

有了刚才的科普,你肯定明白了行在画这个饼的深意:

因为对方的数据量已经越过了“奇点”(而不自知),行在肯定不满足于仅仅给对方一把“剑”(IT),他想做的是直接搞一套“智能系统”,帮他们舞剑,一波带进DT时代!

对方一听,口水流下来:“从订单到交货?这,能做出来吗?”

是啊。。。能做出来吗?

老实说,这其实是奇点云的第一个制造业客户。虽然行在拍胸脯,但制造业毕竟不同于零售和金融,它内部的数据关系极其复杂 ,到底里面有啥“神坑”,谁也说不好呀。。。

来,我们把镜头转向命运的大坑,坑旁边站着一个人,对即将发生的事情还懵然无知,此人就是航宇。

航宇

(三)我给数据“织渔网”

航宇是个学霸。

学霸也分很多种,有些“理论派”学霸喜欢把炫耀当成目的,可航宇却是“实干派”,他把解决问题当成目的——他关心 Why,但更关心 How。

你看,他本科时学的是汽车机械,研究生又转到工业软件方向,这都是社会主义现代化建设过程中最“解恨”的专业。

2009年硕士毕业后,他自告奋勇加入了国内著名的数字化咨询企业汉得信息。由于他的学霸人设,当时都没有走培训流程,直接进驻了一个做电梯的企业甲方,帮他们升级 IT 系统。

很快航宇的凶悍之处就开始显露——他可太沉得住气了——跟着这家电梯企业“上上下下”了4年,期间经历了系统建设思路反复讨论、调整,更迭了好几次,才终成正果。

看到这些过往,你大概会对他的“超能力”有点感觉:航宇不仅一直站在制造业身边,庖丁解牛一般理解制造业 IT 系统的技术细节,更稀罕的是,他对制造业企业一路跋涉的“历史足迹”有切身的体感。

2020年,航宇加入奇点云。

当时的进度是:A企业刚刚圈定几家意向合作伙伴,奇点云只是其中之一。对方让大家是骡子是马先拿出方案看看。。。

要命的是,有一位竞争对手很厉害,它不仅服务过制造业,而且它就是从制造业企业孵化出来的。。。

相比之下,奇点云虽然自信在底层技术上无人能敌,但毕竟制造业的行业经验有限——很多术语、数据结构方案团队都得一边学一边弄,压力山大。

航宇一看,嚯,这不是撞枪口上了吗?制造业我可太熟了,我来对接!

果然,航宇一顿神侃,跟A企业交流完全在一个频率上,加上行在之前画的“饼”比别人都香,最终奇点云有惊无险地从诸多强手嘴里抢下了这块“肥肉”。

话说这个项目看上去是肥肉,可一口咬下去。。。里面全是钉子!就在航宇带着奇点云的精锐工程师进驻A企业后,他的头瞬间大了三圈。。。

你还记得“数据第一性原理”吧。要想从数据中得出正确的预测,得满足三个先决条件:

1)要有数据;2)数据要准;3)数据还得连起来。

不吹不黑,这家企业是行业翘楚,在数据方面已经做得很好了,但很多细节仍然没满足这三个条件:

比如,有些地方没数据。

某个元器件有两家供应商,互为备份——如果甲供应商交货延迟,就可以用乙供应商来顶上。

这个事儿归一位专门的负责人管理,每当他觉得甲供应商要出幺蛾子,就直接联系乙供应商发货。

看上去很正常,但你发现问题了没:无论是供应商的数据,还是判断的逻辑,都在这个负责人脑袋里,对于数据系统来说,他是一个“外挂”,是离线的。

要想让系统“舞剑”,关键数据怎么能外挂呢?!

于是航宇他们赶紧写了好多界面,让相关负责人把脑袋里的数据统统补进系统。

再比如,有些地方数据是“死”的。

有一个零件的库存系统里,设置的安全库存是30件。如果库存少于30件,就会提示补货。

航宇就问负责库存的同事,这里为啥是30件。对方说,不为啥,因为上一个同事就填了30件。一圈文下来,居然没人能说明白这里为啥是30。。。

你看,这就是一个“死数据”。

航宇他们只好把企业里的供应链专家拉过来,重新讨论这里安全库存的判断逻辑,然后重算新值。

新值不仅填的有道理,还能随生产节奏或季节的变化而调节,它被“救活了”。

还比如,有些地方数据不通。

在制造一台手机的过程中,有两道工序都需要同一种原料。

可是这两道工序没有“相互通气”,它们分别填写了采购需求,在填写的时候,为了保证生产,自然要留出一些冗余嘛。

可问题是,如果两道工序共用一种原料,他们就应该一起订货,并且合用一份冗余就够了呀!

因为这两个工序是独立进化出来的,没人做过统筹,所以它俩根本不知道对方的存在。奇点云的老师傅就得在这两个数据库中间建一座桥,打通这些“孤岛”。

三个例子讲完了。

你发现没:填写数据、改正数据、打通数据,事儿都不难。难的是你得找到该填哪些数据,改那些数据,打通哪些数据。

每当这个时候,航宇过去十年的修炼的“超能力”就灵魂附体——因为他曾跟着很多制造业企业一起建设过IT系统,了解它们的“历史包袱”,什么地方容易出现数据错漏,掐指一算,就八九不离十↓↓↓

你可能会说吐槽,这也不坑啊。。。

其实,当时的局面还有反差的另一面:

客户看到的是,每天跟航宇商量,他都一副羽扇纶巾,胸有成竹的亚子;客户没看到的是,每天晚上下班以后,才是航宇一身冷汗的时候。。。

因为除了航宇以外,奇点云其他的工程师老师傅对制造业都太陌生了。

陌生到啥程度呢?

举个栗子,采购订单里有一项参数应该叫PO行(hang),可不熟悉的人会错念成PO行(xing)。

你可能又会吐槽,念什么不吃饭啊?把活儿干了就行了呗?

并不是这样。你是去服务企业的,理论上你应该比企业更懂才有资格服务人家,可是如果连最基础的词都念错,你后面再说啥人家都不想听了啊。。。

况且,问题不止出在行业词汇的读音上。

比如,制造业的数据库格式也和零售业不同。制造业有很多“大宽表”,在建索引时用标准的探测器直接去探测,效率就很低,得专门为制造业调整参数后才好用。

总之当时的局面是:老师傅虽然“铸剑”技术一流,但是必须得学会制造业的领域知识,才能让铸出的剑更顺手。

于是那几个月,航宇每天白天带着老师傅在客户现场部署,到了晚上就拿出小本本开始“制造业大讲堂”——今天学的知识明天就考,还不能错,压力简直比高考还大。

当时几位同事真的是一边哭一边学啊。。。

功夫不负苦心人,老师傅死去活来三个月后,突然发现自己可以跟A企业的同事谈笑风生了。

眼看活儿越干越顺,老师傅可以叼着雪茄写代码了吧?

呵呵。

别忘了他们是干啥来的,把数据打通只是基础,怎么在上面做出对生产的预测,缩短“从订单到交货”的周期,才是摆在他们面前真正的考题!

这事儿,地球上就几乎没人干过,老师傅也得摸石头啊。。。

这是客户现场,为了保密,我把背景都打了码。

当时航宇坐镇帐中苦思冥想,把脑袋里十多年的经验又榨取了N遍,想出的方案总是不太满意。

不过在他和技术老师傅聊天时,总听到他们张口闭口都在讲一个词——“埋点”。

所谓埋点,是数据智能领域的基础技术思想。

简单来说就是:在系统产生关键数据的地方,放一颗探针,用探针把这些关键数据“扎”上来,系统就能对它们进行联合分析了。

既然“埋点”的思路在互联网、新零售、金融领域都成了通用玩法,那在制造业能行得通吗?

航宇散落的思绪突然开始自己拼接起来!

“从订单到交货”本质上也可以抽象为一个工作流,其中包含了运营、计划、生产、仓储物流、财务结算等等模块,每个模块在运转过程中又可以分解为很多固定的“动作”。

在这些动作里都“埋上点”,不就能构建出流程的全貌了吗?

这个思路表面通顺,但仔细一看有个 Bug:制造业企业在进化过程中遗留了一个“缺陷”,由于数据长期分散在各个系统里,导致每个系统对同一个“动作”的定义不一定相同。

比如“客户下单”,有的是通过线上下单,有的是邮件,还有电话、传真下单;

比如车辆发货,仓库系统认为出了仓库大门就算发货,运输系统认为装到车上就是发货,财务系统认为客户确认才是发货。

定义不同,拼在一起肯定会出事儿。。。

“但无论怎样,只要各个部门坐在一起商量,总能定义出一个动作,就叫“订单生效”,也能定义出一个动作,就叫“发货成功”!”航宇想。

说干就干!

他想办法把流程中涉及到的7个部门的经理都请到一起开会,就干一件事儿——把上百个关键“动作”都摆在桌面上,挨个统一定义。

话说,7个部门的大佬聚在一起掰扯,那场名蔚为壮观。

但只要他们“打”成一致后,接下来植入探针的工作就是洒洒水了——整个制造流程中的关键数据被密布的探针穿成一个渔网,只要提纲挈领,不就能一把抓起了吗?!

事实证明,这个操作大获成功:

没有数据平台时,7个部门经理的眼里只能看到自己的那部分系统,想替整个流程操心都操不了;

现在有了数据平台,他们的视野一下子拉开,所有人眼里都看到同一张“大图”,各自负责的那部分在大图中所处的位置也清晰可辨!

在同一张图的基础上继续探讨,就很容易发现“全局策略”:

比如,X订单突然要加急,加塞在Y订单前面,那么不仅是制造排期要调整,X订单用到的原材料也得赶紧进货,哪怕价格稍高一点儿也能接受;

比如,有一个元件的库存目前比较高,按理说应该降低库存以节省成本,但Z订单优先级突然调高,要保证100%按时交货,此时就不能降库存,而应该用库存冗余来换取交期时间缩短。

以上只是例子,像这样的策略还可以写出很多。

只要把策略都编成代码,放在数据平台上,让机器人(在专家监督下)执行,不就能实现“订单交期”和“成本”的智能平衡了吗?

更厉害的是,这些策略在平台上运行是完全透明的,7个部门的老师傅都可以看到。

他们可以根据策略运转的情况,结合自己部门的经验继续改进这些策略,从而让策略“循环迭代”,交期越来越短。

话说,本来这个项目几个月就能干完。可是,奇妙的化学作用发生了:

随着每天开会讨论,7个部门经理对数据平台理解越来越深入,逐渐意识到这玩意儿比他们想象中强大得多,于是自发想出了很多新点子,希望在自己负责的系统内部多加一些组件,以便观察更细致的指标。

一位经理说得很实在:“如果不把这些指标搞出来,我怕跟不上我们老板数字化的节奏啊。。。”

于是,在第一期底层数据平台还没搞完时,A企业就直接揪住奇点云续签了两个新项目,“采购数据子平台”和“质量管理数据子平台”。

三件事儿加在一起,从2020年12月,一直干到2021年10月。好家伙,老师傅去的时候是冬天,回来的时候又快冬天了。

这一年打了无数“怪兽”,不仅是航宇,还有项目团队的所有老师傅,经验值都飕飕地飙升。

项目验收的时候,行在也跑去了现场,一是为了感谢客户信任,二是要亲眼见证“项目最终效果比他2020年画的大饼还要大”是一种怎样的体验。。。

目睹A企业同事们脸上的激动,行在意识到一个严肃的事情:制造业即将涌起的“数据智能”大潮,可能比之前预计的还要凶,这种史诗级的历史关头,奇点云决不能当配角,而是要做主演!

于是行在火速成立了“制造业产品线”,航宇也顺理成章地成为这条产线的负责人。

按理说,在A企业里锻炼了一身腱子肉,后面再服务别的企业,应该能轻松加愉快了吧?

非也。

其实技术的魅力恰在于此,它有点像我们脚下的大地。每次老师傅们费尽气力建设一个新的技术地层,用户都会迅速爬到上面,提出新的需求。你建设地层的速度越快,用户新需求产生的也越快,这是一个永无止境的轮回。

这不,刚站在浪潮之巅的奇点云,马上就得学会在浪尖上“跳芭蕾”。

(四)在浪尖上跳芭蕾是一种怎样的体验?

2022年春天,几枚凄厉的导弹划破夜空,俄乌战争拉开帷幕。

几个月后,航宇坐在一家光伏制造企业B的办公室里。

由于石油价格疯涨,全球对光伏能源的需求暴增,B企业疯狂扩产。一只手数钱数到手抽筋,另一只手却掂着一个“甜蜜的烦恼”:

出口到欧洲和美国的产品,有非常严格的标准,其中有一条要求就是:每一件产品都必须能追溯到原料的产地和批次。

话说,B企业也是行业大佬,质量追溯体系本来就有。但问题是,2022年他们新建了很多工厂,产能突然打着滚地往上翻,加之国外的追溯要求突然加码,原来自己搭建的数据平台“爆仓”了,算不出来。。。

情况危急,他们直接在上海成立了数字化转型办公室,招聘顶尖的技术人才,血本投入。

即便是这样,尝试了大半年之后,数据平台的性能还是距离期望有好大一截。

航宇去的时候,对方说得很明白:“去年我们自己做了一波数据平台,没做成;后来找了一家公司帮我们做,也没做成。你们是第三波,你们要是失败了,我们还会找第四波。反正什么时候干成什么时候算!”

一听这话,航宇马上就明白了:自己遇到了**“顶级客户”**。

怎么个顶级法呢?

首先,光伏是制造业皇冠上的明珠,在所有制造业中它的自动化程度是最高的(之一),数据密度和数据质量无人能出其右;

其次,中国大力鼓励光伏产业,企业手握最好的政策资源,往前冲就完事儿了,没有后顾之忧;

最后,由于石油价格暴涨,光伏产业刚好站在全球工业的浪潮上,愿意大笔投资未来。

不是有句话么,五岳归来不看山,黄山归来不看岳。

这家企业就像是制造业里的“黄山”。如果它的所有需求都能搞定,奇点云就妥妥的神功练成独孤求败了!

“这才是学霸要干的事儿嘛!”航宇兴奋地搓手手。

他和团队赶紧把之前在企业A里打磨的数据平台拿过来复用。这时才发现,之前的平台还是太糙了。。。

怎么糙呢?

如果数据平台只用来“管理订单”,那么它的最小颗粒度就是“一批产品”,只需要在产品批次的**“流转动作”**上埋点就够了;

但如果用来“追溯原料”,它的最小颗粒度就是所有的原材料,于是除了原有的埋点以外,还需要在每个产品的具体**“生产动作”**上也都埋点。

这么说吧,如果之前的埋点密度像是纵横的渔网,那现在的埋点密度就像是细密编织的布料。

不就是把点埋的多一点么?好像也没啥吧。。。

但事实并非如此。

咱们都学过《核舟记》,如果在一块一人来高的木头上雕出个关二爷,那一般的匠人都行,但要在一个核桃上雕刻出苏子鲁直佛印泛舟,那非得“奇巧人王叔远”才行。

说个具体的栗子吧:

在某个生产环节上,有三台上料机,两条组装线——任何一台上料机都可以给任何一条组装线上料。

那你回溯的时候,怎么知道是哪个上料机供的料呢?

要解决这个问题,要么就再加两条生产线,让上料机一对一服务;要么就在三台上料机和五条生产线上全部埋点,精确记录每一次供料的详情。

这还仅仅是最容易理解的例子,真实的生产过程充满了各种难与人言的“数据断点”。

搞这种事情,几乎没有好办法,只能是奇点云的老师傅和B企业的工程师们每天坐在一起开会,像做卷子一样一个问题一个问题地解。

航宇记得很清楚,他们驻场在B企业的几个月,经常在一个大会议室里讨论。会议室有三面墙都是整块的玻璃,可以用马克笔写字。

每次开会都是所有玻璃从左上角写到右下角,密密麻麻全部写满。等到两周以后下一次开会,又是所有玻璃都写满。

牛X的是,每次墙上的内容都完全不同。

你大概能体会,这群人讨论的信息量有多大了。

有趣的是,就在这个项目进行的2022年,奇点云团队的老师傅们早已不是那个不会读“OP行”的行业小白了,而是个顶个的满级专家,跟对方讨论的时候专业性一点不落下风。

有时候人家说了个什么意见,奇点云的老师傅直接站起来,给人家来一顿科普,争得面红耳赤。。。

这种情况一多,B企业的工程师都懵了,到底谁是甲方啊?!

虽然这个画面有点喜感,但航宇觉得,这才对味儿了。

我开会总跟大家说,我们帮人家做事情,“思考”是很重要的。但有比“思考”还重要的,其实是“驱动”。

“思考”大多是被动的,客户提出一个什么问题,我们来思考怎么解决。但“驱动”是我把我能想到的问题也摆出来,和客户一起解决。

当你把驱动力展现出来的时候,表面上可能是和客户争论,但本质上,这表明了你懂行业,你不仅有和客户对话的资格,更有帮助他转型的资格,这恰恰是客户对你产生信心的一刻!

航宇笑。

回到我们的故事,奇点云和B企业的老师傅手拉手埋头苦干,终于把沉甸甸的数据平台搭建完成,大伙儿像火箭点火一样,眼含热泪郑重启动。

瞬间,平台上的数据像春天原野上的草一样,疯狂生长,细密编织,每一件产品的前世今生都能被看得清清楚楚。

萦绕在B企业心头一年多的产品追溯难题,终于解决了!

就在大家欢呼雀跃时,很多人都注意到了一个“One more thing”:

厂区的生产负责人突然有了一双“火眼金睛”!

过去一个工单下达之后,老师傅就只能在一旁“看热闹”了,只能等到所有工序走完再来“拆盲盒”一样复盘效果。

现在由于所有中间节点的数据都完全透明,仿佛车间里突然有了“X光”,原来笼罩在黑盒子里的“生产细节”都在大屏幕上一览无余。

如此一来,在生产的过程中就能介入调整,从而提高生产效率。

这可不是开玩笑:产线效率每提升一点儿,就是多赚一笔钱啊!

很快,B企业的几位生产负责人就组团找到航宇,提出一个紧急要求:

我们能不能提高数据更新的频率,从一天一次,变成一小时一次啊?!这样就能做更多的“微操”啦!

航宇拍胸脯,没问题!

生产负责人就把数据收集和计算的频率直接调高了24倍。

万没想到,就是这个操作引发了“地震”。

奇点云的数据平台底座叫做 DataSimba。

话说,DataSimba 在设计的时候是非常考究的——为了保证绝对稳定,会在工作载荷的基础上留下10倍的冗余量。

可是。。。10倍的冗余量,架不住24倍的计算提升啊。。。

最先发现有点不对劲儿的,是B企业的几位工程师:咦,以前这时候数据已经出来了,今儿怎么还都没看到?

找奇点云同学一看,我勒个去!!!凌晨时分出现一波计算任务的超大高峰,现在后面的任务已经拥塞,排队能绕了地球三圈了——数据平台分分钟有种想躺平的意思。。。

这显然超出了现场团队的能力范围,紧急任务直接怼到了 DataSimba 平台的开发团队负责人,也就是奇点云的技术一号位,地雷眼前。

地雷**(和他的马克笔)**

(五)数据关乎生死 

地雷是个技术理想主义者。

理想到啥程度呢?

如果你质疑他长得不帅,他虽然完全不同意你的看法,但也能呵呵一笑不跟你计较。

但,如果你胆敢质疑他和团队的手艺不到位,他能几天不睡觉来证明你是错的!!

这不,当时正赶上2022年12月疫情放开,地雷刚阳了,躺在床上额头烫得能煎鸡蛋,就听到前线传来消息——DataSimba 快顶不住了。

地雷直接“垂死病中惊坐起”,爬到电脑前面,用“含着刀片”的嗓子跟大家开会。

因为 DataSimba 是奇点云部署在各行各业的通用底层平台,地雷之前并不会特别把注意力倾斜在制造业上。

这次紧急支援,他分析了一下B企业体内 DataSimba 的运转情况,然后直接惊了:

“制造业的数据量居然这么大!和零售、金融完全不在一个量级。”

你想想看,B企业是光伏制造企业,光伏企业的特色是“垂直整合”,意思是从原材料开采,到半成品切方,到成品制造它都干。

每个工序都有专门的工厂负责,每个工厂的制造、仓储、运输又几乎全部是自动化的,而每个自动化设备都在24小时源源不断地产生数据,加在一起,这数据量能不逆天么?

“既然数据比想象中多,那加几台机器不就得了?”我问地雷。

“还加机器?不减机器就谢天谢地了!”地雷冷笑。

当时的具体情况是酱的:

并不是每个小时的计算量都超过系统负载,而是只有凌晨3:00-4:00、5:00-6:00两个时间段超过了负载。

这就意味着,如果能够巧妙地削平一天当中计算量的波峰和波谷,现有计算力还是够的↓↓↓

在这个前提下,加机器对地雷来说就是一种侮辱。。。

地雷曾经供职阿里巴巴,在他看来,这个事情和“双11”有点像。

如果土豪不计成本,买几十万台服务器,肯定能扛住双11那天的峰值。但如果当年阿里巴巴那样干,不仅服务器的成本直接爆棚,更失去了对阿里云、数据库、大数据平台等等一系列技术进行磨炼的机会。

况且,过去几年,DataSimba 还有个主线任务——要不断减少单位任务需要的计算力。

2021年时 DataSimba 部署在企业里,最少都要11台服务器;2022年中,已经变成了最少6台;这件事儿发生时,地雷他们正在尝试把最小服务器数量压缩到2-3台。

虽然问题很棘手,但地雷摆出一副蔑视的表情。这一方面是因为他阳了眼睛不大睁得开,另一方面,其实他手里有个“大杀器”。

这就是“元仓体系”。

简单来说,元仓体系就像是数据平台的神经系统,它可以对平台自身各个细节指标进行观测,然后汇总起来进行健康分析。(你也可以把元仓理解为“数据生产线”自己的埋点和指标)

话说,以往的数据平台根本是没有“神经系统”的,因为不需要——反正平台上跑的数据都没那么重要,即便出点儿问题也不会死人,修好就行了,为啥要煞有介事搞一整套神经系统嘞?!

但是技术理想主义者地雷不这么认为。

他老早就断言,数据平台一定会进驻越来越重要的场景,有朝一日,数据平台挂一秒都会要命,不允许“先坏再修”。

凭着这个信念,他力主研发元仓体系。

这不,就在2022年底,“元仓体系”刚刚开发完成,正在秘密测试中。

这下也不用测试了,直接上战场吧!

新鲜出炉的“元仓”接入B企业,很快,“神经系统”返回了很多指标,真相随之一点点勾勒出来。

为了让你感受到这里的硬核技术之美,我决定给你讲几个真实的细节:

1、比如“作业最晚执行时长”这个指标,它能找出成千上万个作业里,最后做完的那一个。

(点击可以看大图)

通过这个指标,地雷他们发现,在1:00-2:00这个时间段内,最晚一个搞定的作业居然拖到了2:15——和下一批作业重叠了。

但拖延的原因并不是因为这个作业真的很难,而是调度过程中策略有些松散,给了它机会“摸鱼”。

果然,调整调度策略,这个问题就消失了。

2、还有“等待资源的作业数”和“执行中的作业数”这两个指标。

这两个指标对比一看,地雷他们很快发现,有个别任务一直在门口排队。

仔细一排查,原来是这个任务和某项配置“八字不合”,导致它每次都会卡顿。

过去计算没那么密集的时候,它卡半个小时一使劲也就过去了,现在计算密集,它再卡半个小时,后面的队伍都憋疯了。。。

配置一调,问题也没了。

3、再比如“调度执行时长”和“作业执行时长”,这两个指标分别显示了一个任务“单纯在调度阶段的耗时”和“总耗时”。

显然对于所有任务来说,调度花的时间都不应该占总时长太大的比例。但查看指标,发现有一些任务的主体计算早就做完了,但是系统对它的调度却一直没停。这太反常了。

根据这个线索,地雷发现问题出在了“交作业”这一步——提交结果的时候,一个日志接口优化不够,出现了给老师交完作业还得在学习委员那排队“登记”的情况。

他们于是调整了日志写入模式,这个问题也迎刃而解。

地雷告诉我,当时大部分的问题改起来不困难,但也有个别问题很棘手,他们甚至得进入 Java 虚拟机,把人家内存释放的算法都给魔改了一通,才终于搞定。

话说,回到历史的现场,“技术的困难”倒还在其次,主要的问题是“身体的困难”。

问题排查前后经历了10天,可是,在那个特殊的时期,却没有一个人能撑过10天。。。

地雷回忆,当时兄弟们的冲锋堪称前赴后继。

DataSimba 的首席架构师鱼飞最先扛旗,可是才扛了两天,他就阳了,高烧不退,眼看就有烧糊涂的趋势。

二号位的架构师明瑞赶紧自告奋勇:“我来!”明瑞扛了一周,解了无数 Bug,眼看胜利在望,他也阳了。。。赶紧把没解决的问题“托孤”给第三位架构师。

眼看元旦假期到了,可事关B企业的生产效率,分分钟几百万上下,客户非常着急,两边老师傅谁都没放假,一边线上开会,一边咳嗽此起彼伏。

就这样,这场从一天算一次到一小时算一次的“地狱升级”终于被扛下来。

B企业领导非常开心,揪着地雷问:接下来我们准备把计算密度再提升12倍,从每小时一次变成每五分钟一次。再给你们10天,能干完吗?

回头一看,地雷快跪地上了。

如果计算密度再提升12倍,那连底层的计算引擎都要从离线引擎换成流式引擎,所有查询语句都要针对新引擎重写。

虽说技术上没有不可逾越的难度,但毕竟相当于把汽车改飞机,肯定不是10天能搞定的了。劝了半天,对方领导才同意稍微缓缓再干。

那天加班到很晚,地雷坐在空荡荡的办公室里,心底却突然涌上甜蜜。

数据关乎生死的时代,终于来了。

(六)从“起夜级”到“企业级” 

在奇点云有一支神奇的队伍,名为“蝙蝠侠”。

这群蝙蝠侠的超能力就是“起夜”。。。

你看,无论啥行业,数据平台上必然有很多计算任务是每天一次的,只有在夜里12点以后数据才凑齐,才能开始算。

所以,负载高峰一般都出现在后半夜,万一出毛病。。。也很可能在后半夜。。。

每当这时,蝙蝠侠就来活儿了,他们昼伏夜出,半夜帮客户平事儿,清晨第一抹阳光照耀大地,数据平台恢复如常,蝙蝠侠们事了拂衣去。

这是蝙蝠侠专用的办公室

但从制造业开始,剧本彻底变了。

因为数据平台嵌入了生产的“黄金流程”里,生产一秒不停,数据平台也一秒不能停。这种情况下,就算蝙蝠侠凌晨三点“起夜”也没戏。

数据平台必须从“起夜级”变成“企业级”——不仅不允许分秒卡顿,还要有超强的自愈能力,最好像太阳一样,永远热烈,永远照常升起。

为了实现这个 Mission Impossible,2023年5月,地雷团队把**“元仓体系”**正式挂载在数据平台中,可以通过“体征”变化而提前发现异常,治于未病,争取达到扁鹊他大哥的效果。

拿着闪闪发光的数仓,航宇他们终于可以放心大胆地用各种姿势征服一个又一个客户了。

航宇告诉我,截止2023年夏天,奇点云已经累积服务了几十家制造业企业,这种“遍插红旗”的速度,比当年攻克其他行业都更迅猛。

但另一个烦恼也随之而来:客户太多,行业专家不够分了。

航宇干脆牵线搭桥,把自己的良师益友,也是另一位“远征军”云风介绍给了奇点云。

云风

话说,熟悉云风的人都愿意叫他的昵称,校长。

校长这个名字实至名归。

当年航宇之所以坚定地投身制造业,就是因为校长去学校做宣讲招聘,让他深受鼓舞。

校长1998年加入汉得,很快就在公司内部开设了“黄埔军校”,专门对新来的同学进行“魔鬼训练”。

在他手中,一批批制造业的专家被培育出来,源源不断进入了中国的各大企业,成为制造业数字化建设的重要力量,可谓桃李满天下。

行在三顾茅庐,邀请校长加盟,他对校长郑重地说:“你是老革命了。但老革命要装备新武器!在奇点云,你手上会一直有最先进的武器。”

校长被这句话深深打动,义无反顾地加入奇点云。

后来行在告诉我,他其实跟每一位行业专家都是这么说的。。。

这倒不是行在不走心,而是因为这是一句郑重的承诺。用岁月去践行的承诺,有一句足矣。

校长坐镇,开始为奇点云培养大批行业专家,这些行业专家进入不同的制造企业,各自发掘出各种更深的数据应用场景。

地雷和校长

校长告诉我,有两个数据应用方向让他非常激动:

第一件事是“良率提升”。

在我们之前提到的A、B两个企业中,数据平台的作用都是提高“效率”。但是,如果把数据的触角再深入一层,到达每一台机器里的每一个参数设置,就可以直接提高生产的“良率”。

其实,每一条生产线在生产一批产品前,都需要请来一个神秘的老师傅,让他根据现场情况对机器里成百上千的参数进行“调参”。

这些参数如果配合合理,能让产品良率大大提升。但是调参是个手艺活儿,主要凭手感,经验来自于老师傅几十年的积累。

如果人工智能学会老师傅的调参技巧,再利用数据平台接管这些参数,就可以直接成为AI老师傅,虽说和人类顶尖高手还有差距,但是比肩2-5年的师傅是很有希望的。

如此一来,机器就可以把各种产品灵活地混搭在一起生产,根据当前的产品类型和自己的工作状态实时调整自己的参数,每一个刀锋和齿轮都仿佛有了灵魂。

第二件事儿是“普惠”。

你还记得吧,奇点云服务的大多是“顶级客户”——各个细分领域的龙头企业。

这当然是因为龙头企业敢想敢试,也有试错的勇气和成本。

但反过来看,如果期待中国制造业整体飞跃,只有龙头企业往前冲是肯定不够的。

有朝一日,“金字塔”腰部和底座的中小企业能够享受数据智能的荣光,中国制造业才能告别浓烟和汗水,迎来真正意义上的产业升级。

中小企业一般利润不多,预算有限,肯定不能让工程师驻场几个月来一场“脱胎换骨”。他们需要的是更简单的,拆盒就用的数据产品。

为了做出这样的产品,校长正带着一群人闭关修炼,试着把来自几十家制造企业的经验汇总起来,抽象成一个个“乐高积木块”。

期待有朝一日,所有中小企业需要的数据平台,都可以用其中一部分积木拼插而成。

他不仅期待,而且深信这一天会到来。

(七)远征军的会师 

为了打磨数据产品,校长会经常找机会和各家企业的CIO(首席信息官)聊天。

越聊越激动。

他发现,企业的 CIO 正在变成另一个物种。

原来, CIO 只负责 IT 系统建设,所以只研究代码就够了;

现在,新一代 CIO 肩负企业数据智能转型的使命,他们不仅要懂代码,更要懂数据,而要想理解数据,首先要深刻理解业务。

这群又懂业务,又懂技术,又懂数据价值的人,正在每一个制造企业崭露头角,成为中国制造业的中坚力量。

从天空俯瞰,两支分头出发了20多年的远征军正在会师。

左边,中国企业家们用微薄的利润不断滚动,逐渐装备了最先进的生产线和制造工艺,让“中国制造”成为优质的代名词;

右边,“数据远征军”们去各行各业卧薪尝胆,带回最强的数据平台和智能技术。出走半生,他们重又相逢。

一杯浊酒,聊慰风尘。他们还要继续远行。

航宇告诉我,即便他站在制造业最前沿,也没办法望断数据技术的尽头。

最初大家连订单交期都无法预测。

后来数据平台帮能预测交期,大家又在想如何优化交期?

交期优化了,大家又想预测两个订单摆在一份产能面前,我该接哪个更好?

能够匹配订单之后,大家又在想能不能让系统自动排列订单?

然后大家又会想,下游的物流应该怎么调度才能效率最高?

如果这个也能做到,大家又会想,能不能把良品率提高万分之一?再提高万分之一?

他细细数着。

你看,从“数据第一性原理”出发,对未来预测的准确度如果达到90%,还可以向99%进发,然后还可以向99.9%进发。

即便你手上有海量的数据,预测的准确度也永远不可能达到100%,因为那是上帝的领地。

但每精进一点点,你都会得到应有的回报,并为此欢欣鼓舞。

正所谓,进一步有进一步的欢喜。

临近告别时,我随口问地雷:“你们为什么能做成这件事儿?”

他的答案出乎意料:“因为我们幸运地生在中国。”

你要知道,很多东西不会必然出现在每个人的命运里。

我有一个朋友,当初跳槽到 Google,他设计系统的架构让美国工程师感到很惊讶。对方问他为什么这么设计,他说,因为我见过“双11”。

制造业也是同样的道理:

我们首先生在中国,然后才有机会面对这么完整的工业体系,面对这么大量的自动化产线,面对这么丰富的数据场景,才有机会遇到这么多愿意出钱探索数据智能的企业,才有机会遇到这么多极致的需求。

而“需求”,是技术人最大的幸福。

他语气很平静,显然这是经过无数次思考后的最终答案。

行在喜欢徒步,也喜欢带公司的小伙伴一起徒步。

为了置身绝美的风景,他们有时会迷路,靠手里小小的指南针猜测方向。但终究他们一次次远行,又一次次安然返航。

而他们在数据世界里的故事,又何尝不是同样的历程?

25年前,他身边几乎所有的数据都属于外企,而如今,数据平台技术、数据本身、数据所栖息的数据库,甚至产生数据的生产线 MES 系统也都在一点点被中国人理解和掌握。

这是另一场更漫长的,用生命时光才得以丈量的中国数据技术的远行。

两千年前,摩西曾劈开红海,带着以色列人回到故乡。

两千年后,一群赤子正带着有关中国数据的一切,赶回故乡。

延伸阅读:

《14亿人的生活琐事,正在变成永不枯竭的石油》

《你在被窝里刷手机岁月静好,一个引擎却在远方和时间赛跑》

回首向来萧瑟处

也无风雨也无晴

再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。**我的日常是和各路大神聊天。**如果想和我做朋友,**可以搜索微信:**shizhongmax

哦对了,如果喜欢文章,请别吝惜你的**“在看”“分享”****。让有趣的灵魂有机会相遇,会是一件很美好的事情。**

Thx w****ith  in  Beijing

相关推荐
关注或联系我们
添加百川云公众号,移动管理云安全产品
咨询热线:
4000-327-707
百川公众号
百川公众号
百川云客服
百川云客服

Copyright ©2024 北京长亭科技有限公司
icon
京ICP备 2024055124号-2