vivo推荐中台升级路:机器成本节约75%,迭代短周期低至分钟级
洪泽娱乐新闻网 2025-07-27
基于上述痛点,vivo AI 破例改建工程制作团队在提炼了资讯流破例、截图破例、音乐破例等多个破例经营范围,为了从根源彻底解决线性乘积生产商成本的难题,原创性的明确指出了外观上堆放,外观上集和确立基准外观上增值的两大本质。
外观上堆放,是通过外观上改建工程把 Raw 信息抽取转简化为一个外观上,在外观上SDK登记为一个新外观上元信息资讯(Metadata),揭示了这个外观上打印的方式则,信息多种类型,间距,默认值等,并且可以对该外观上分设多项目相关联,约降至外观上构建的用以。
外观上集,是一个各种类型迅捷的外观上集合本质,按照数学方法乘积的市场需求,可以自由从外观上平板(外观上堆放)上勾选无需的外观上元信息,类似购物车的本质,按需静态勾选一个也就是说当前数学方法特训的外观上集。
由于所有经营范围都在天开破例里面台登记外观上、勾选外观上集,从而进一步倡导了外观上相关联构建的可能会。如果一个外观上已经在SDK上登记过,其他经营范围和情节无需构建,相应的线性土木改建工程只无需核发相关联,通过合规批文不久,就可以通过勾选外观上集,使用自己的数学方法特训和的网站解答。在此在此之前,vivo 各个搜广举经营范围是通过外观上 SDK 来独立给予外观上,每个经营范围无需根据线性土木改建工程相关联的多个包含外观上装配及 Redis 坦克部队资讯的 XML PDF,分解一个 FeatureBean 实体,通过外观上 SDK 连接到 XML 里面相关联的 Redis 坦克部队地址,根据自己的市场需求分步骤多次搜索出无需的使用者外观上、天级塑料外观上、准实时塑料外观上、再通过外观上 SDK 交叉外观上,整个给予外观上的时序较为有用,尤为感严厉批评的是每次减少外观上,无需联动更改 XML、FeatureBean 实体类、外观上处理方式则code块等多个前方的code范式;虽完成度不大,减少外观上的时序却很繁琐。
为了彻底解决这个复合合深的痛点,vivo AI 破例改建工程广州制作团队明确指出了一个迅捷极高效的方案,用SDK确立负责管理的网站预期的解答装配外观上集替代于是就改建工程里面 XML、YAML 这些相反性较差的装配PDF。
外观上增值主要功能有意识导图
外观上增值,“外观上即增值” FaaS (Feature as a Service) 摒弃排气管式的外观上抽取和外观上给予的不尽力质,把外观上给予这个关键性步骤直接增值简化。确立基准外观上增值,是 vivo AI 研究院广州制作团队打造的与外观上负责管理SDK连动的一个可装配简化外观上增值。外观上增值在破例查找阶段搜索哪些外观上,简约到SDK确立负责管理,在SDK迅捷勾选无需的外观上逐步形成外观上集,的网站给予外观上的时候,加载确立基准外观上增值的接口,传入外观上集的唯一 ID,外观上增值根据外观上集元信息静态迅捷给予无需的外观上,一次前往给的网站解答改建工程,通过外观上拼接转入 Tensorflow 数学方法开展 CTR 实时预期。举算出来破例结果。
对比在此之前的外观上 SDK 基本上,确立基准外观上增值的效果较为轻微:
基本上外观上 SDK 与确立基准外观上增值时序对比
增设一次外观上的线性乘积的生产商成本大幅大大提极高:增设外观上不无需更改code,不无需月初后尾端增值,只无需在天开·破例里面台更改外观上集即可,线性乘积时序从 2 人 / 天拉长到 5~30 分钟; 外观上堆放大大提极高了全都域外观上信息构建可能会:外观上信息也只无需打印一份即可,避免了由于外观上不相关联造成的资讯梦幻,以及由此带来的信息打印层的浪费。数学方法堆放与数学方法增值
数学方法备份特训处理过程尤其长,分作前期的极高效调参与备份特训,线性上司在对参数等调整和检验不久,通过重写 YAML PDF的游戏数学方法特训参数,督导分布式调度侦查,开展数学方法的特训及分解。在侦察数学方法增值的时候,线性上司首必先无需与改建工程共同开发人员协调该数学方法用作到外观上及用作方式则,然后改建工程上司据此来重写外观上搜索 XML 与数学方法外观上拼接的彻底解决问题code,通过备份检验后,无需手动在发布种系统侦察该数学方法视作的网站增值。类似于情况下,可以由线性上司来重写数学方法外观上拼接的彻底解决问题范式,但是这对于线性上司的改建工程意志力要求较极高,另外,就算可以彻底解决问题,重写与督导生产商成本也难于给予前提。
从备份数学方法侦察到的网站解答增值的处理过程里面,无需较多的手动开展数学方法就其的装配(数学方法特训 YAML 与的网站解答的 XML),以及改建工程和线性人员大量的口头上协调,从而带来较极高的协同生产商成本与犯错概率。
数学方法堆放,主要是对备份特训开展的数学方法开展确立负责管理,并且相关联备份数学方法的一键侦察意志力。线性上司在开展数学方法特训不久,只无需相符该备份数学方法符合预期并转到数学方法堆放。
数学方法增值,“数学方法即增值”(Model as a Service), 基于 VMFC 的备份特训给予数学方法,在数学方法堆放一键侦察视作的网站增值,即可此前相关联基准的的网站预期接口。
数学方法增值侦察图
数学方法写入与预热
数学方法堆放里面维护该数学方法的种系统简化资讯,有数数学方法 ID,数学方法轨迹等,在一键侦察数学方法的时候,发布种系统在叫停增值时,根据该资讯写入数学方法,获得成功后再通过组装恳求,开展数学方法预热。
基本功能扩缩容
在侦察数学方法时候,我们要求数学方法增值实例是大概 2 个,避免单点故障。而在实质的线上解答处理过程里面,通过分设 vivo 试管SDK的扩缩容意志力,彻底解决问题流量极高偏高峰期,的网站增值的优点扩缩容。
GPU 解答意志力
当前 vivo 破例经营范围的的网站解答主要是基于 Tensorflow 的 CPU 解答,同时我们发掘出 CPU 解答依赖于一些难题。
生产商成本难题,CPU 利用率不能很偏高(40% 以上,增值受罚),数学方法有用后,无需减少成倍的机器; 耐用性难题,对于有用数学方法,CPU 机器开展解答受罚相当严重,无需用作 GPU 来彻底解决解答加速的难题。基于右边的难题,vivo 近年也在 TensorFlow GPU 解答领域想到了一些探究,由于 GPU 芯片Core的独特性,不开展优简化的原始 TensorFlow 数学方法,很难借助于 GPU 的算力。一开始,我们把特训导出的 TensorFlow 数学方法经过 ONNX 转换成 TensorRT 数学方法,通过解答增值框架 Triton 写入 TensorRT 数学方法,这样确实能大大提极高 GPU 的利用率,但是也依赖于一些难题,比如部分破例数学方法从 TensorFlow 转换到 TensorRT 依赖于黎曼不赞同的情况,无需手动共同开发 TensorTR 黎曼,而通常破例经营范围的线性数学方法乘积种系统换用kHz尤其极高,的网站解答改建工程简化的共同开发周期很难满足线性数学方法快速乘积的市场需求。最后我们联合杭州数学方法Core制作团队通过多进程 + MPS + TensorFlow Runtime 的核心技术方案合上,既能借助于 GPU 的算力,同时部分情节还不无需对数学方法开展 TensorRT 转换。
确立基准 GPU 解答Core
因此我们的的网站解答增值就能赞同侦察到 CPU 和 GPU 增值器,在侦察片段为了让相异的镜像来赞同侦察到相异的机器教育资源。在加载线上解答增值的时候,通过全都权层封装加载细微,彻底解决问题极高效传输数据。
确立基准的外观上处理方式则
在 CPU 与 GPU 的解答彻底解决问题里面,数学方法解答入参多种类型是不相反的,这引发了有两套的外观上处理方式则范式,在实质线性试验中乘积处理过程里面,才会带来额外的共同开发实习量。所以我们针对这个难题,此前观上处理方式则开展封装,彻底解决问题相异的举算教育资源下,有别于同一套外观上处理方式则范式,降偏高重复共同开发实习。在经营范围层面不无需关注底层有别于的是 CPU 还是 GPU 教育资源,只无需着重于经营范围范式和大大提极高破例效果。
合上实践与科技成果
vivo AI 破例改建工程广州制作团队把装配简化解答增值的整体设计者在横版截图、PDA隐喻、智者视窗资讯流、原子核朗读等多个破例经营范围上想到了合上实践。
PDA隐喻破例经营范围传输数据破例里面台后,备份数学方法特训后通过数学方法堆放一键侦察截止,无需更改code和人工操作发布种系统,普通数学方法试验中截止周期从 4 小时降偏高到 30 分钟近。同时,对经营范围范式简约模块简化设计者,相结合破例里面台的分层试验中功能,试验中乘积生产商成本轻微大大提极高,同小时内可赞同的试验中也从 5 个大大提极高到 20 个。
智者视窗资讯流经营范围在数学方法解答片段,针对有用数学方法有别于 GPU 解答,在压测下 P95、P99 延迟都有轻微降偏高, 整体的 QPS 大大提极高平均值 5.2 倍。
CPU/GPU 解答耐用性压测信息对比
在相同精排恳求 600 QPS,3000 Batch size 下,经测算数学方法解答机器生产商成本节省平均值 75% 近。
GPU 解答在智者视窗资讯流合上生产商成本对比
另外, 2022 年 Q1~Q2 季度在横版截图经营范围上全都时序(召回、查找、外观上键入等片段)率必先合上了外观上堆放和确立基准外观上增值,摒弃了草率的装配PDF和 Hard Code 的基本上外观上 SDK 方式则给予外观上,传输数据外观上增值不久,助力线性土木改建工程和信息土木改建工程大大提极高外观上和数学方法的乘积生产商成本,从改建工程难题和相反性难题里面解放出来,把精力再度回归到此前观上的抽取和数学方法试验中效果的大大提极高上。对比传输数据外观上增值在此之前,整体国民生产商总值据悉 +3.8%、CTR 持平、RCTR +0.6%,间隔小时完播率也均有所提极高,破例效果稳步大大提极高。
原子核朗读经营范围在外观上键入片段,通过外观上集的方式则想到键入,只用既有的外观上 XML 方式则,后续外观上的乘积都只无需在外观上SDK上想到简单的装配,彻底解决问题零code种系统换用换用。外观上信息的变更乘积无需信息、改建工程等多方协调,乘积周期从天级降偏高到分钟级。
从上图对比可以看出,在外观上截止的生产商成本和外观上给予的耐用性两方面有较轻微的战术上。同时由于传输数据确立基准外观上增值,线上、近线、备份的外观上给予和处理方式则也都用作了确立基准外观上增值一套举算和处理方式则函数范式,路由相反性给予安全都及,目前为止合上的经营范围路由相反性均>99.9%。
外观上增值已经有 24 小时平均值耗时曲线图
通过多个经营范围的部分情节合上检验,确立基准外观上增值在耐用性上看作不错的表现和外观上可装配的迅捷性,通过此前观上给予轨迹的简约和解复合Core设计者,彻底解决了耐用性和迅捷度不可兼得的难题,外观上增值的网站上的外观上给予,在给予塑料外观上 Batch Size 是 40 ,外观上集里面塑料外观上个数是 250,单次加载外观上增值可给予 10,000 条外观上信息。在目前为止MMORPG TPS 100 情况下,MMORPG每秒可给予外观上总数约达 10,000,000 条,拥有很极高的吞吐意志力。通过装配简化够零code侦察截止,具备分布式、极高比方说,以及海量吞吐的意志力,真正够外观上开箱即用,外观上即增值。
总结新发展
综上所述,通过数学方法外观上确立准则与装配,彻底解决问题备份特训与的网站解答的比对、外观上相反;通过外观上堆放与外观上增值,彻底解决MMORPG受压停滞,大大提极高外观上给予和处理方式则的乘积生产商成本;通过数学方法堆放与数学方法增值,彻底解决问题数学方法的全都生命周期负责管理,并且相关联一键侦察意志力;通过 CPU 和 GPU 的异构解答装配,可以迅捷赞同相异经营范围的解答市场需求。
近期装配简化解答增值已经在 vivo 横版截图、PDA隐喻、智者视窗资讯流、原子核朗读等破例经营范围逐步合上,后续我们将对接更多的破例经营范围,持续完善破例里面台的模块和意志力建设,提极高经营范围的乘积生产商成本,助力经营范围大大提极高破例效果。
笔记解说
王兆雄、严鹏、吴伟兴、陈炜基,vivo AI Core土木改建工程,来自 vivo AI 研究院破例改建工程组广州制作团队。
制作团队解说:vivo AI 破例改建工程组广州制作团队,长期兼职 AI Core土木改建工程 / 核心技术专家,负责破例、搜索经营范围多个方向的种系统生产商实习,坐标广州。追捧热衷的同窗转到我们。可投简历至:wuweixing@vivo.com(邮件隐喻劝注明:vivo 破例改建工程组广州制作团队)
未能投入生产商的数学方法很难为跨国公司或组织建构效用,作为 AI 改建工程里面极其重要的组成,MLOps 的再次出现正是为了降偏高这种无用功。其明确指出了有数核心技术细微、最佳实践和工具,来希望线性数学方法尽力合上到经营范围实践里面。将于上周 7 月 31 日 -8 月 1 日主办的 QCon 全都球软件共同开发大才会(广州站)「AI 改建工程与 MLOps 」研讨将发掘知名制作团队的实践案例。
点个在看少个 bug👇
。吉林男科医院哪家看的好上海看癫痫的医院哪家好
安徽白癜风医院哪里最好
山西男科医院哪家更好
郑州不孕不育专科医院哪个好
新闻专题
支气管炎咳嗽老不好怎么办
医疗美容医院
甘油三脂高
儿童止咳化痰常备药品清单
-
小小说:门庭
写真 2025-08-23以后钩起一旁备下的土壤逐一地基。也就一袋烟功夫,两座倒是的墓堆就堆得据传更高。外甥将不锈钢手拿插到墓上,郭据传两头早就摆好纸钱,把一堆烧纸放好正待燃烧,外甥吓得过来阻挠:“
-
李雪琴和谁最搭?《你好,星期六》今晚开启甜蜜“恋”
图片 2025-08-23今晚(周二)20:10,王祖紫色、李雪琴、毛较难、翟潇闻等人将集体大放异彩《你好,周日》,启动时两场甜蜜“恋爱”。其之中,李雪琴趣味剧女主;毛较难送暖心恋爱感恩;翟潇闻则会场演绎出民间音乐版《这
-
5月刚上新15款新机,全都是重量级,市场又一波大洗牌
时尚 2025-08-23随着Vivo释出了X80第一部不久,坚信国内的笔记型电脑低价之际不会离开一个相对安静的整年。意味着颇受欢迎笔记型电脑制造厂商们该释出的机动部队笔记型电脑均已经完成了关的释出工作,而在之际离开的十
-
武磊吴兴涵建功!绿茵原版高考国足2-0菲律宾,延续晋级12强赛希望
八卦 2025-08-23高考此后,国在家身球队员不想被封禁!北京时间6月8日凌晨,2022 卡塔尔世界杯亚洲区资格赛A三组40极强赛头球,国在身凭借武磊和湖州天等的助攻2-0战胜马尼拉队员,延续止步12极强的努力。
-
张金九:玉石上行动能不足 今日玉石走势分析及策略
资讯 2025-08-235月底31日,据悉星期六,因美国星期四开市阻碍,消费市场交投比较清淡,白盘美元净负债承压走低,之上黄金和白银等产品脉动走高,接下来当权优化修订后,美盘承压上方压力进行下滑,黄金和白盘遥相呼应1848依