国产欧美日韩三区_偷窥自拍亚洲色图精选_久久大片网站_成人在线黄色_成人亚洲免费视频_99久久久精品_国产美女自拍_韩国19禁主播vip福利视频_色综合视频一区二区三区日韩_日本在线观看一区二区

當前位置:首頁 > 科技  > 手機

訓練MoE足足提速70% 華為只用了3招

來源: 責編: 時間:2025-06-04 08:02:10 115觀看
導讀 Scaling Law之下,MoE(混合專家)如今已經成為各大模型廠商擴展模型能力的制勝法寶。不過,在高效實現模型參數規?;耐瑫r,MoE的訓練難題也日益凸顯:訓練效率不足,甚至一半以上訓練時間都浪費在“等待”

Scaling Law之下,MoE(混合專家)如今已經成為各大模型廠商擴展模型能力的制勝法寶。pYh28資訊網——每日最新資訊28at.com

不過,在高效實現模型參數規模化的同時,MoE的訓練難題也日益凸顯:pYh28資訊網——每日最新資訊28at.com

訓練效率不足,甚至一半以上訓練時間都浪費在“等待”上。pYh28資訊網——每日最新資訊28at.com

訓練MoE足足提速70% 華為只用了3招pYh28資訊網——每日最新資訊28at.com

現在,為了突破MoE的訓練瓶頸,華為出手了:pYh28資訊網——每日最新資訊28at.com

構建了一套名為Adaptive Pipe & EDPB的優化方案,開啟“上帝視角”,讓MoE面臨“交通擁堵”的訓練集群,實現無等待流暢運行。pYh28資訊網——每日最新資訊28at.com

MoE大規模訓練難題:一半以上的訓練時間在等待?pYh28資訊網——每日最新資訊28at.com

實踐已經表明,MoE模型訓練集群的效率面臨兩方面挑戰:pYh28資訊網——每日最新資訊28at.com

首先,是專家并行引入了計算和通信等待。pYh28資訊網——每日最新資訊28at.com

當模型規模較大時,需要切分專家到不同設備形成并行(EP),這就引入額外All-to-All通信。pYh28資訊網——每日最新資訊28at.com

與此同時,MoE層絕大部分EP通信與計算存在時序依賴關系,一般的串行執行模式會導致大量計算單元空閑,等待通信。pYh28資訊網——每日最新資訊28at.com

訓練MoE足足提速70% 華為只用了3招pYh28資訊網——每日最新資訊28at.com

其次,負載不均會引入計算和計算等待。pYh28資訊網——每日最新資訊28at.com

MoE算法核心是“有能者居之”,在訓練過程中會出現部分熱專家被頻繁調用,而冷專家使用率較低的情況。pYh28資訊網——每日最新資訊28at.com

同時,真實訓練數據的長度不一,不同的模型層(如稀疏層、嵌入層等)的計算量也存在明顯差異,造成不同卡之間計算也在互相等待。pYh28資訊網——每日最新資訊28at.com

用一個形象點的說法就是,MoE訓練系統就像一個存在局部交通阻塞的城區,面臨兩大核心問題:pYh28資訊網——每日最新資訊28at.com

-人車混行阻塞:所有車輛(計算)與行人(通信)在紅綠燈交替通行,互相等待。pYh28資訊網——每日最新資訊28at.com

-車道分配僵化:固定劃分的直行、左轉車道就像靜態的專家分配,導致熱門車道(熱專家)大排長龍,而冷門車道(冷專家)閑置。pYh28資訊網——每日最新資訊28at.com

針對以上問題,華為團隊打造了“智慧化交通”設施:pYh28資訊網——每日最新資訊28at.com

首先,建造“行人地下通道”(通信掩蓋技術),徹底分離人車動線,使計算不再等待通信。pYh28資訊網——每日最新資訊28at.com

其次,部署“智能可變車道”(動態專家路由),根據實時車流(數據分布)動態調整車道功能,讓閑置的左轉車道也能分擔直行壓力,實現負載均衡。pYh28資訊網——每日最新資訊28at.com

這套組合方案既解決了資源分配不均的問題,又消除了通信阻塞的瓶頸,就像為城市交通裝上了“智慧大腦”,讓每個方向的通行效率都得到大化提升。pYh28資訊網——每日最新資訊28at.com

DeployMind仿真平臺,小時級自動并行尋優pYh28資訊網——每日最新資訊28at.com

具體來說,華為首先構建了名為DeployMind的仿真平臺,它是一個基于昇騰硬件訓練系統的“數字孿生”平臺,通過計算/通信/內存三維度的多層級建模、昇騰硬件系統的高精度映射、全局化算法加速運行等技術,能在1小時內模擬百萬次訓練場景,實現MoE模型多樣化訓練負載的快速分析和自動找到與集群硬件規格匹配的優策略選擇。pYh28資訊網——每日最新資訊28at.com

在訓練實踐驗證中,該建??蚣芸蛇_到90%精度指標,實現低成本且高效的優并行選擇。pYh28資訊網——每日最新資訊28at.com

針對Pangu Ultra MoE 718B模型,在單卡內存使用約束下,華為通過DeployMind以訓練性能為目標找到了TP8/PP16/VPP2/EP32(其中TP只作用于Attention),這一適合昇騰集群硬件規格的并行方案,綜合實現計算、通信、內存的佳平衡。pYh28資訊網——每日最新資訊28at.com

通信掩蓋>98%,讓計算不再等待通信pYh28資訊網——每日最新資訊28at.com

華為還提出了一套名為Adaptive Pipe的通信掩蓋框架。在DeployMind仿真平臺自動求解優并行的基礎上,采用層次化All-to-All降低機間通信和自適應細粒度前反向掩蓋,實現通信幾乎“零暴露”。pYh28資訊網——每日最新資訊28at.com

層次化專家并行通信pYh28資訊網——每日最新資訊28at.com

針對不同服務器之間通信帶寬低,但機內通信帶寬高的特點,華為創新地將通信過程拆成了兩步走:pYh28資訊網——每日最新資訊28at.com

第一步,讓各個機器上“位置相同”的計算單元聯手,快速地從所有機器上收集完整的數據塊(Token);pYh28資訊網——每日最新資訊28at.com

第二步,每臺機器內部先對數據塊進行整理,然后利用機器內部的高速通道,快速完成互相交換。pYh28資訊網——每日最新資訊28at.com

這種分層設計的巧妙之處在于,它把每個數據塊多的復制分發操作都限制在單臺機器內部的高速網絡上完成,而在跨機器傳輸時,每個數據塊只需要發送一份拷貝,相比傳統All-to-All通信加速1倍。pYh28資訊網——每日最新資訊28at.com

也就是說,有效通過減少跨機通信,提升了集群的通信速度。pYh28資訊網——每日最新資訊28at.com

自適應細粒度前反向掩蓋pYh28資訊網——每日最新資訊28at.com

在DualPipe掩蓋框架的基礎上,華為基于虛擬流水線并行技術,實現了更精密的調度,即Adaptive Pipe。pYh28資訊網——每日最新資訊28at.com

訓練MoE足足提速70% 華為只用了3招pYh28資訊網——每日最新資訊28at.com

相比DualPipe,Adaptive Pipe僅利用一份權重,不僅將流水線并行所需的內存占用減半,有效降低了計算“空泡”,釋放了流水線的峰值性能潛力;同時,該策略能夠額外實現與分層通信的完美協同,無縫覆蓋機間與機內兩層通信的掩蓋。pYh28資訊網——每日最新資訊28at.com

在這種層次化通信和細粒度計算通信切分調度優化下,Adaptive Pipe可實現98%以上的EP通信掩蓋,讓計算引擎不受通信等待的束縛。pYh28資訊網——每日最新資訊28at.com

訓練MoE足足提速70% 華為只用了3招pYh28資訊網——每日最新資訊28at.com

克服負載不均,訓練再加速25%pYh28資訊網——每日最新資訊28at.com

由于MoE模型訓練過程中天然存在的負載不均問題,集群訓練效率時高時低,華為團隊還提出了EDPB全局負載均衡,實現專家均衡調度。pYh28資訊網——每日最新資訊28at.com

在優并行和通信掩蓋基礎上,EDPB再取得了25.5%的吞吐提升收益。pYh28資訊網——每日最新資訊28at.com

訓練MoE足足提速70% 華為只用了3招△集群P2P通信分析對比pYh28資訊網——每日最新資訊28at.com

所謂EDPB,E是專家預測動態遷移。pYh28資訊網——每日最新資訊28at.com

MoE模型訓練中,設備間的專家負載不均衡如同“蹺蹺板”——部分設備滿載運行,另一些卻處于“半休眠”狀態。團隊提出了基于多目標優化的專家動態遷移技術,讓專家在分布式設備間“智能流動”。pYh28資訊網——每日最新資訊28at.com

該技術主要有三個特點:pYh28資訊網——每日最新資訊28at.com

-預測先行,讓專家負載“看得見未來”:預測負載趨勢,實現“計算零存儲開銷,預測毫秒級響應”;pYh28資訊網——每日最新資訊28at.com

-雙層優化,計算與通信的黃金分割點:提出節點-設備雙層貪心優化架構,在讓計算資源“齊步走”的同時,給通信鏈路“減負”;pYh28資訊網——每日最新資訊28at.com

-智能觸發,給專家遷移裝上“紅綠燈”:設計分層遷移閾值機制,通過預評估遷移收益動態決策,實現專家遷移的智能觸發。pYh28資訊網——每日最新資訊28at.com

訓練MoE足足提速70% 華為只用了3招△基于專家動態遷移的EP間負載均衡整體框架圖pYh28資訊網——每日最新資訊28at.com

D是數據重排Attention計算均衡。pYh28資訊網——每日最新資訊28at.com

在模型預訓練中普遍采用數據拼接固定長度的策略,但跨數據的稀疏Attention計算量差異顯著,會引入負載不均衡問題,導致DP間出現“快等慢”的資源浪費。pYh28資訊網——每日最新資訊28at.com

為解決這一問題,華為團隊提出了一種精度無損的動態數據重排方案,其核心在于:通過線性模型量化單樣本計算耗時,在嚴格保持訓練精度無損下,批次內采用貪心算法構建小化耗時的數據重排,實現負載均衡。pYh28資訊網——每日最新資訊28at.com

P是虛擬流水線層間負載均衡。pYh28資訊網——每日最新資訊28at.com

MoE模型通常采用混合結構,Dense層、MTP層、輸出層所在的Stage與純MoE層所在的Stage負載不均,會造成的Stage間等待。pYh28資訊網——每日最新資訊28at.com

華為團隊提出虛擬流水線層間負載均衡技術,將MTP層與輸出層分離,同時將MTP Layer的 Embedding計算前移至首個Stage,有效規避Stage間等待問題,實現負載均衡。pYh28資訊網——每日最新資訊28at.com

訓練MoE足足提速70% 華為只用了3招△基于異構模塊設計的VPP并行負載均衡pYh28資訊網——每日最新資訊28at.com

系統端到端72.6%訓練吞吐提升pYh28資訊網——每日最新資訊28at.com

在Pangu Ultra MoE 718B模型的訓練實踐中,華為團隊在8K序列上測試了Adaptive Pipe & EDPB吞吐收益情況。pYh28資訊網——每日最新資訊28at.com

實驗結果顯示,在優并行策略的初始性能基礎上,華為這套“通信掩蓋+動態專家遷移”的優化方案,能實現系統端到端72.6%的訓練吞吐提升。pYh28資訊網——每日最新資訊28at.com

訓練MoE足足提速70% 華為只用了3招pYh28資訊網——每日最新資訊28at.com

總而言之,華為的這套打法可以說是為大模型訓練優化提供了關鍵路徑。感興趣的小伙伴可以再通過完整技術報告深入了解——pYh28資訊網——每日最新資訊28at.com

技術報告地址:https://gitcode.com/ascend-tribe/ascend-training-system/tree/main/DistributedOptimizationpYh28資訊網——每日最新資訊28at.com


文章出處:量子位

本文鏈接:http://m.yifxia.cn/showinfo-22-155755-0.html訓練MoE足足提速70% 華為只用了3招

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: REDMI電競小平板本月發:8英寸板王

下一篇: 性能碾壓競品!紫光展銳W527穿戴芯片發布:12nm工藝、支持4G

標簽:
  • 熱門焦點
Top 欧美电影免费| 日本特黄特色aaa大片免费| 欧美激情在线精品video| 久久国产精品永久免费网站| 国产韩国精品一区二区三区| 国产视频一区在线| 国产福利免费观看| 久草免费资源| 国产韩国精品一区二区三区| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 夜夜操网| 亚洲精品中文字幕久久久久久| 日韩在线观看免费| 韩国三级香港三级日本三级| 国产麻豆精品| 国产麻豆精品免费视频| 国产亚洲精品aaa大片| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 四虎影视久久久免费| 成人高清视频免费观看| 国产成+人+综合+亚洲不卡| 久久久久久久网| 国产一区二区精品| 青青久久国产成人免费网站| 国产网站在线| 久久国产精品永久免费网站| 精品视频在线观看视频免费视频| 可以免费看污视频的网站| 青青青草影院| 午夜久久网| 国产高清视频免费观看| 成人免费观看的视频黄页| 精品在线观看一区| 日日日夜夜操| 精品久久久久久中文字幕一区| 你懂的国产精品| 日韩综合| 国产成人啪精品视频免费软件| 美女免费精品高清毛片在线视| 亚洲不卡一区二区三区在线| 国产一级强片在线观看| 成人免费观看的视频黄页| 久久精品免视看国产成人2021| 国产伦精品一区二区三区无广告| 午夜精品国产自在现线拍| 四虎久久精品国产| 日韩免费片| 99久久精品国产免费| 九九精品久久久久久久久| 国产一区二区精品尤物| 九九九网站| 999精品在线| 麻豆网站在线看| 91麻豆精品国产片在线观看| 二级片在线观看| 欧美国产日韩一区二区三区| 日韩专区亚洲综合久久| 天堂网中文在线| 亚洲 国产精品 日韩| 欧美18性精品| 欧美国产日韩在线| 欧美一区二区三区性| 欧美激情一区二区三区在线播放 | 国产一区二区精品在线观看| 欧美大片aaaa一级毛片| 中文字幕97| 韩国毛片免费大片| 久久国产精品永久免费网站| 欧美激情在线精品video| 999精品视频在线| 天天色成人网| 欧美a级v片不卡在线观看| 精品视频在线观看一区二区| 色综合久久天天综合| 九九九网站| 久久99欧美| 九九精品久久久久久久久| 国产成人啪精品| 日韩在线观看视频网站| 国产高清在线精品一区二区| 国产一区二区高清视频| 久久国产一区二区| 二级片在线观看| 日韩中文字幕一区二区不卡| 国产亚洲精品aaa大片| 日韩综合| 国产精品自拍在线观看| 麻豆污视频| 黄视频网站免费看| 青青久热| 国产伦久视频免费观看 视频| 免费国产一级特黄aa大片在线| 国产成人欧美一区二区三区的| 国产成人精品影视| 超级乱淫伦动漫| 精品国产一区二区三区免费 | 精品国产一区二区三区久| 国产国产人免费视频成69堂| 欧美国产日韩久久久| 亚洲精品中文一区不卡| 日本伦理片网站| 亚洲第一色在线| 高清一级做a爱过程不卡视频| 精品视频在线看 | 日日爽天天| 精品国产亚洲人成在线| 韩国毛片| 国产一区二区精品| 精品国产亚一区二区三区| 九九精品久久久久久久久| 欧美大片a一级毛片视频| 午夜精品国产自在现线拍| 国产欧美精品午夜在线播放| 美女被草网站| 久草免费在线观看| 91麻豆国产| 欧美激情一区二区三区视频高清 | 日韩免费在线视频| 91麻豆精品国产自产在线| 国产韩国精品一区二区三区| 天天做日日爱夜夜爽| 日韩女人做爰大片| 青青久热| 青青久久国产成人免费网站| 日本特黄一级| 国产麻豆精品高清在线播放| 黄视频网站在线免费观看| 国产一区二区精品久久91| 欧美一区二区三区在线观看| 九九久久国产精品大片| 国产伦精品一区三区视频| 亚洲第一页色| 青青久久国产成人免费网站| 精品国产一区二区三区久久久狼| 精品视频在线观看免费| 欧美18性精品| 欧美另类videosbestsex久久 | 99热精品在线| 欧美日本免费| 成人影院一区二区三区| 亚欧成人乱码一区二区| 国产视频一区在线| 日日爽天天| 国产美女在线观看| 成人a级高清视频在线观看| 四虎久久精品国产| 日韩免费在线| 国产综合91天堂亚洲国产| 久草免费在线观看| 国产一区二区精品久久91| 成人免费观看的视频黄页| 精品久久久久久综合网| 成人在激情在线视频| 欧美日本二区| 韩国三级香港三级日本三级| 精品视频在线观看免费| 色综合久久天天综合观看| 精品国产一区二区三区久久久狼| 亚洲精品久久玖玖玖玖| 国产一区二区精品| 精品久久久久久中文字幕一区| 久久精品道一区二区三区| 成人高清视频在线观看| 国产成人女人在线视频观看| 国产视频一区二区在线播放| 国产麻豆精品免费密入口| 欧美国产日韩在线| 亚洲精品久久玖玖玖玖| 欧美另类videosbestsex久久 | 日韩免费在线| 日本在线不卡视频| 免费毛片播放| 国产成人精品综合久久久| 亚欧成人乱码一区二区| 毛片高清| 成人高清视频免费观看| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 九九九国产| 精品在线观看一区| 日韩av成人| 国产成a人片在线观看视频| 青青久久精品| 精品视频在线看 | 久久久成人网| 日本免费乱人伦在线观看| 一级片免费在线观看视频| 精品视频在线观看一区二区三区| 天天做日日干| 国产国语在线播放视频| 国产麻豆精品免费密入口| 亚洲 男人 天堂| 日韩一级黄色| 色综合久久天天综线观看| 欧美激情一区二区三区视频高清| 午夜精品国产自在现线拍| 国产欧美精品午夜在线播放| 天堂网中文在线| 国产原创中文字幕| 夜夜操网| 91麻豆精品国产自产在线观看一区|