11月21日,2025AI容器应用落地与发展论坛在上海举行。华为公司副总裁、数据存储产物线总裁周跃峰在论坛上发布AI容器期间——Flex:ai。同期,会上晓示,将此项产学勾通明果向外界开源体育游戏app平台,助力破解算力资源诓骗费力。 公开尊府显现,容器期间当作一种轻量级捏造化期间,不错将模子代码、运转环境等打包成一个沉寂的、轻量级的镜像,罢了跨平台无缝转移,贬责模子部署“环境竖立不一致”的痛点。容器还不错按需挂载GPU(图形处理器)、NPU(神经相聚处理器)算力资源,按需分拨和回收“资源”,...

11月21日,2025AI容器应用落地与发展论坛在上海举行。华为公司副总裁、数据存储产物线总裁周跃峰在论坛上发布AI容器期间——Flex:ai。同期,会上晓示,将此项产学勾通明果向外界开源体育游戏app平台,助力破解算力资源诓骗费力。
公开尊府显现,容器期间当作一种轻量级捏造化期间,不错将模子代码、运转环境等打包成一个沉寂的、轻量级的镜像,罢了跨平台无缝转移,贬责模子部署“环境竖立不一致”的痛点。容器还不错按需挂载GPU(图形处理器)、NPU(神经相聚处理器)算力资源,按需分拨和回收“资源”,陶冶集群合座资源诓骗率。
征询机构Gartner称,AI负载好多王人运转在容器中,强延迟性的容器期间将进一步鼓吹AI应用的部署落地。其展望,到2027年,75%以上的AI应用将禁受容器期间进行部署。
刻下,AI产业高速发展催生海量算力需求,但大家算力资源诓骗率偏低的问题日益突显,“算力资源亏损”成为产业发展的重要费力:小模子任务独占整卡导致资源闲置,大模子任务单机算力不及难以守旧,大宗穷乏GPU/NPU的通用处事器更是处于算力“就寝”景象,供需错配形成严重的资源亏损。
“大任务单机算力不够用,需要多个机器或者合成一个更雄壮的卡。还有多任务并发的时辰,移动怎么办?”周跃峰说,Flex:ai需要贬责这些问题。
华为先容,本次发布并开源的Flex:ai XPU(各式类型处理器)池化与移动软件,是基于Kubernetes容器编排平台构建,通过对GPU、NPU等智能算力资源的缜密化管制与智能移动,罢了AI责任负载与算力资源的精确匹配,可大幅陶冶算力诓骗率。
周跃峰暗示,华为将和联系勾通高校合手续完善AI容器软件Flex:ai,让Flex:ai的用户和竖立者将软件用得越来越好,让AI或者着实罢了难民化。
海量资讯、精确解读,尽在新浪财经APP
背负剪辑:刘万里 SF014体育游戏app平台