vivo推荐中台升级路:机器成本节约75%,迭代短周期低至分钟级
洪泽娱乐新闻网 2025-07-27
基于上述痛点,vivo AI 破例改建工程制作团队在提炼了资讯流破例、截图破例、音乐破例等多个破例经营范围,为了从根源彻底解决线性乘积生产商成本的难题,原创性的明确指出了外观上堆放,外观上集和确立基准外观上增值的两大本质。
外观上堆放,是通过外观上改建工程把 Raw 信息抽取转简化为一个外观上,在外观上SDK登记为一个新外观上元信息资讯(Metadata),揭示了这个外观上打印的方式则,信息多种类型,间距,默认值等,并且可以对该外观上分设多项目相关联,约降至外观上构建的用以。
外观上集,是一个各种类型迅捷的外观上集合本质,按照数学方法乘积的市场需求,可以自由从外观上平板(外观上堆放)上勾选无需的外观上元信息,类似购物车的本质,按需静态勾选一个也就是说当前数学方法特训的外观上集。
由于所有经营范围都在天开破例里面台登记外观上、勾选外观上集,从而进一步倡导了外观上相关联构建的可能会。如果一个外观上已经在SDK上登记过,其他经营范围和情节无需构建,相应的线性土木改建工程只无需核发相关联,通过合规批文不久,就可以通过勾选外观上集,使用自己的数学方法特训和的网站解答。在此在此之前,vivo 各个搜广举经营范围是通过外观上 SDK 来独立给予外观上,每个经营范围无需根据线性土木改建工程相关联的多个包含外观上装配及 Redis 坦克部队资讯的 XML PDF,分解一个 FeatureBean 实体,通过外观上 SDK 连接到 XML 里面相关联的 Redis 坦克部队地址,根据自己的市场需求分步骤多次搜索出无需的使用者外观上、天级塑料外观上、准实时塑料外观上、再通过外观上 SDK 交叉外观上,整个给予外观上的时序较为有用,尤为感严厉批评的是每次减少外观上,无需联动更改 XML、FeatureBean 实体类、外观上处理方式则code块等多个前方的code范式;虽完成度不大,减少外观上的时序却很繁琐。
为了彻底解决这个复合合深的痛点,vivo AI 破例改建工程广州制作团队明确指出了一个迅捷极高效的方案,用SDK确立负责管理的网站预期的解答装配外观上集替代于是就改建工程里面 XML、YAML 这些相反性较差的装配PDF。
外观上增值主要功能有意识导图
外观上增值,“外观上即增值” FaaS (Feature as a Service) 摒弃排气管式的外观上抽取和外观上给予的不尽力质,把外观上给予这个关键性步骤直接增值简化。确立基准外观上增值,是 vivo AI 研究院广州制作团队打造的与外观上负责管理SDK连动的一个可装配简化外观上增值。外观上增值在破例查找阶段搜索哪些外观上,简约到SDK确立负责管理,在SDK迅捷勾选无需的外观上逐步形成外观上集,的网站给予外观上的时候,加载确立基准外观上增值的接口,传入外观上集的唯一 ID,外观上增值根据外观上集元信息静态迅捷给予无需的外观上,一次前往给的网站解答改建工程,通过外观上拼接转入 Tensorflow 数学方法开展 CTR 实时预期。举算出来破例结果。
对比在此之前的外观上 SDK 基本上,确立基准外观上增值的效果较为轻微:
基本上外观上 SDK 与确立基准外观上增值时序对比
增设一次外观上的线性乘积的生产商成本大幅大大提极高:增设外观上不无需更改code,不无需月初后尾端增值,只无需在天开·破例里面台更改外观上集即可,线性乘积时序从 2 人 / 天拉长到 5~30 分钟; 外观上堆放大大提极高了全都域外观上信息构建可能会:外观上信息也只无需打印一份即可,避免了由于外观上不相关联造成的资讯梦幻,以及由此带来的信息打印层的浪费。数学方法堆放与数学方法增值
数学方法备份特训处理过程尤其长,分作前期的极高效调参与备份特训,线性上司在对参数等调整和检验不久,通过重写 YAML PDF的游戏数学方法特训参数,督导分布式调度侦查,开展数学方法的特训及分解。在侦察数学方法增值的时候,线性上司首必先无需与改建工程共同开发人员协调该数学方法用作到外观上及用作方式则,然后改建工程上司据此来重写外观上搜索 XML 与数学方法外观上拼接的彻底解决问题code,通过备份检验后,无需手动在发布种系统侦察该数学方法视作的网站增值。类似于情况下,可以由线性上司来重写数学方法外观上拼接的彻底解决问题范式,但是这对于线性上司的改建工程意志力要求较极高,另外,就算可以彻底解决问题,重写与督导生产商成本也难于给予前提。
从备份数学方法侦察到的网站解答增值的处理过程里面,无需较多的手动开展数学方法就其的装配(数学方法特训 YAML 与的网站解答的 XML),以及改建工程和线性人员大量的口头上协调,从而带来较极高的协同生产商成本与犯错概率。
数学方法堆放,主要是对备份特训开展的数学方法开展确立负责管理,并且相关联备份数学方法的一键侦察意志力。线性上司在开展数学方法特训不久,只无需相符该备份数学方法符合预期并转到数学方法堆放。
数学方法增值,“数学方法即增值”(Model as a Service), 基于 VMFC 的备份特训给予数学方法,在数学方法堆放一键侦察视作的网站增值,即可此前相关联基准的的网站预期接口。
数学方法增值侦察图
数学方法写入与预热
数学方法堆放里面维护该数学方法的种系统简化资讯,有数数学方法 ID,数学方法轨迹等,在一键侦察数学方法的时候,发布种系统在叫停增值时,根据该资讯写入数学方法,获得成功后再通过组装恳求,开展数学方法预热。
基本功能扩缩容
在侦察数学方法时候,我们要求数学方法增值实例是大概 2 个,避免单点故障。而在实质的线上解答处理过程里面,通过分设 vivo 试管SDK的扩缩容意志力,彻底解决问题流量极高偏高峰期,的网站增值的优点扩缩容。
GPU 解答意志力
当前 vivo 破例经营范围的的网站解答主要是基于 Tensorflow 的 CPU 解答,同时我们发掘出 CPU 解答依赖于一些难题。
生产商成本难题,CPU 利用率不能很偏高(40% 以上,增值受罚),数学方法有用后,无需减少成倍的机器; 耐用性难题,对于有用数学方法,CPU 机器开展解答受罚相当严重,无需用作 GPU 来彻底解决解答加速的难题。基于右边的难题,vivo 近年也在 TensorFlow GPU 解答领域想到了一些探究,由于 GPU 芯片Core的独特性,不开展优简化的原始 TensorFlow 数学方法,很难借助于 GPU 的算力。一开始,我们把特训导出的 TensorFlow 数学方法经过 ONNX 转换成 TensorRT 数学方法,通过解答增值框架 Triton 写入 TensorRT 数学方法,这样确实能大大提极高 GPU 的利用率,但是也依赖于一些难题,比如部分破例数学方法从 TensorFlow 转换到 TensorRT 依赖于黎曼不赞同的情况,无需手动共同开发 TensorTR 黎曼,而通常破例经营范围的线性数学方法乘积种系统换用kHz尤其极高,的网站解答改建工程简化的共同开发周期很难满足线性数学方法快速乘积的市场需求。最后我们联合杭州数学方法Core制作团队通过多进程 + MPS + TensorFlow Runtime 的核心技术方案合上,既能借助于 GPU 的算力,同时部分情节还不无需对数学方法开展 TensorRT 转换。
确立基准 GPU 解答Core
因此我们的的网站解答增值就能赞同侦察到 CPU 和 GPU 增值器,在侦察片段为了让相异的镜像来赞同侦察到相异的机器教育资源。在加载线上解答增值的时候,通过全都权层封装加载细微,彻底解决问题极高效传输数据。
确立基准的外观上处理方式则
在 CPU 与 GPU 的解答彻底解决问题里面,数学方法解答入参多种类型是不相反的,这引发了有两套的外观上处理方式则范式,在实质线性试验中乘积处理过程里面,才会带来额外的共同开发实习量。所以我们针对这个难题,此前观上处理方式则开展封装,彻底解决问题相异的举算教育资源下,有别于同一套外观上处理方式则范式,降偏高重复共同开发实习。在经营范围层面不无需关注底层有别于的是 CPU 还是 GPU 教育资源,只无需着重于经营范围范式和大大提极高破例效果。
合上实践与科技成果
vivo AI 破例改建工程广州制作团队把装配简化解答增值的整体设计者在横版截图、PDA隐喻、智者视窗资讯流、原子核朗读等多个破例经营范围上想到了合上实践。
PDA隐喻破例经营范围传输数据破例里面台后,备份数学方法特训后通过数学方法堆放一键侦察截止,无需更改code和人工操作发布种系统,普通数学方法试验中截止周期从 4 小时降偏高到 30 分钟近。同时,对经营范围范式简约模块简化设计者,相结合破例里面台的分层试验中功能,试验中乘积生产商成本轻微大大提极高,同小时内可赞同的试验中也从 5 个大大提极高到 20 个。
智者视窗资讯流经营范围在数学方法解答片段,针对有用数学方法有别于 GPU 解答,在压测下 P95、P99 延迟都有轻微降偏高, 整体的 QPS 大大提极高平均值 5.2 倍。
CPU/GPU 解答耐用性压测信息对比
在相同精排恳求 600 QPS,3000 Batch size 下,经测算数学方法解答机器生产商成本节省平均值 75% 近。
GPU 解答在智者视窗资讯流合上生产商成本对比
另外, 2022 年 Q1~Q2 季度在横版截图经营范围上全都时序(召回、查找、外观上键入等片段)率必先合上了外观上堆放和确立基准外观上增值,摒弃了草率的装配PDF和 Hard Code 的基本上外观上 SDK 方式则给予外观上,传输数据外观上增值不久,助力线性土木改建工程和信息土木改建工程大大提极高外观上和数学方法的乘积生产商成本,从改建工程难题和相反性难题里面解放出来,把精力再度回归到此前观上的抽取和数学方法试验中效果的大大提极高上。对比传输数据外观上增值在此之前,整体国民生产商总值据悉 +3.8%、CTR 持平、RCTR +0.6%,间隔小时完播率也均有所提极高,破例效果稳步大大提极高。
原子核朗读经营范围在外观上键入片段,通过外观上集的方式则想到键入,只用既有的外观上 XML 方式则,后续外观上的乘积都只无需在外观上SDK上想到简单的装配,彻底解决问题零code种系统换用换用。外观上信息的变更乘积无需信息、改建工程等多方协调,乘积周期从天级降偏高到分钟级。
从上图对比可以看出,在外观上截止的生产商成本和外观上给予的耐用性两方面有较轻微的战术上。同时由于传输数据确立基准外观上增值,线上、近线、备份的外观上给予和处理方式则也都用作了确立基准外观上增值一套举算和处理方式则函数范式,路由相反性给予安全都及,目前为止合上的经营范围路由相反性均>99.9%。
外观上增值已经有 24 小时平均值耗时曲线图
通过多个经营范围的部分情节合上检验,确立基准外观上增值在耐用性上看作不错的表现和外观上可装配的迅捷性,通过此前观上给予轨迹的简约和解复合Core设计者,彻底解决了耐用性和迅捷度不可兼得的难题,外观上增值的网站上的外观上给予,在给予塑料外观上 Batch Size 是 40 ,外观上集里面塑料外观上个数是 250,单次加载外观上增值可给予 10,000 条外观上信息。在目前为止MMORPG TPS 100 情况下,MMORPG每秒可给予外观上总数约达 10,000,000 条,拥有很极高的吞吐意志力。通过装配简化够零code侦察截止,具备分布式、极高比方说,以及海量吞吐的意志力,真正够外观上开箱即用,外观上即增值。
总结新发展
综上所述,通过数学方法外观上确立准则与装配,彻底解决问题备份特训与的网站解答的比对、外观上相反;通过外观上堆放与外观上增值,彻底解决MMORPG受压停滞,大大提极高外观上给予和处理方式则的乘积生产商成本;通过数学方法堆放与数学方法增值,彻底解决问题数学方法的全都生命周期负责管理,并且相关联一键侦察意志力;通过 CPU 和 GPU 的异构解答装配,可以迅捷赞同相异经营范围的解答市场需求。
近期装配简化解答增值已经在 vivo 横版截图、PDA隐喻、智者视窗资讯流、原子核朗读等破例经营范围逐步合上,后续我们将对接更多的破例经营范围,持续完善破例里面台的模块和意志力建设,提极高经营范围的乘积生产商成本,助力经营范围大大提极高破例效果。
笔记解说
王兆雄、严鹏、吴伟兴、陈炜基,vivo AI Core土木改建工程,来自 vivo AI 研究院破例改建工程组广州制作团队。
制作团队解说:vivo AI 破例改建工程组广州制作团队,长期兼职 AI Core土木改建工程 / 核心技术专家,负责破例、搜索经营范围多个方向的种系统生产商实习,坐标广州。追捧热衷的同窗转到我们。可投简历至:wuweixing@vivo.com(邮件隐喻劝注明:vivo 破例改建工程组广州制作团队)
未能投入生产商的数学方法很难为跨国公司或组织建构效用,作为 AI 改建工程里面极其重要的组成,MLOps 的再次出现正是为了降偏高这种无用功。其明确指出了有数核心技术细微、最佳实践和工具,来希望线性数学方法尽力合上到经营范围实践里面。将于上周 7 月 31 日 -8 月 1 日主办的 QCon 全都球软件共同开发大才会(广州站)「AI 改建工程与 MLOps 」研讨将发掘知名制作团队的实践案例。
点个在看少个 bug👇
。吉林男科医院哪家看的好上海看癫痫的医院哪家好
安徽白癜风医院哪里最好
山西男科医院哪家更好
郑州不孕不育专科医院哪个好
新闻专题
支气管炎咳嗽老不好怎么办
医疗美容医院
甘油三脂高
儿童止咳化痰常备药品清单
-
武汉第二批集中供地拟出让22宗东段 总起始价约119.3亿元
八卦 2025-10-22光明日报讯 (记者饶舒玮)5年初31日,汉口市自然资源和上海市政府Twitter发布日前称,汉口今年第二批集当中供地拟出让22肃南段,土地占地面积达64.8万平方米,总层高达144.65万平方米,总起
-
发展商该取消?央媒30字表态!新规下,2022年起3笔发展商费不用交了
星闻 2025-10-22橱里,发展商和管理公司之间的矛盾可能亦会就迎刃而解了。就比如发展商新规全面实施,2022年起,3未收发展商收取能节省扔掉了。发展商新规全面实施,2022年3未收发展商收取能省扔掉了p
-
70年代“老物件”升值了?部分回收价近10万,家里有的要多提醒
星闻 2025-10-22要肉得好,隔壁得好,出门的运输工具也要好,如果时光可以重来的话,我不想很多人则会愿意离开了那个纯粹的二十世纪吧!。a href="http:zhbdf.qm120.com" t
-
清秀的双钥匙房户型,两代人居住互不干扰
音乐 2025-10-22为什么要选一款好的户型?因为它的可改建性极为强,未来生活的一时期有可能面临和小孩子居住在独自一人,或者有三胎,那么一个小房间的可改建性变回了居家特质的好坏之一。今天我们赞叹一款户型
-
为什么开发商一直强调客厅正厅,而不是强调卧室的大小呢?
时尚 2025-10-22瑞瑞呀,有个小小的难题,为什么开发商一直凸显桌子临街,而不是凸显后院的尺寸呢?我明白后院大才更舒服,桌子够用就行啊。因为一进家门给人好像最反感的称许是桌子啊,而且现有过去做的相对而