華泰證券研報表示,4月11日,毫末舉行第8屆AI DAY,發(fā)布了純視覺為主的DriveGPT大模型,該模型現階段主要用于解決自動駕駛認知決策問題,可以通過輸入駕駛場景數據進行多場景預測并規(guī)劃最佳行徑路途。目前DriveGPT已經包含4000萬公里的量產車駕駛數據、1200億參數,擁有19.6億個30萬類場景標簽。DriveGPT將在今年新摩卡DHT-PHEV車型首發(fā)落地,提升HPilot高速/城市NOH安全性和流暢性。我們認為GPT大模型范式有望賦能垂直領域智能駕駛感知標注、決策推理等核心環(huán)節(jié),加速智駕落地,同時大模型研發(fā)或推動駕駛數據和算力需求快速增長。建議關注L2級自動駕駛/AI算力產業(yè)鏈。
全文如下
華泰 | 電子:從DriveGPT看大模型如何賦能智能駕駛
4月11日,毫末舉行第8屆AI DAY,發(fā)布了純視覺為主的DriveGPT大模型,該模型現階段主要用于解決自動駕駛認知決策問題,可以通過輸入駕駛場景數據進行多場景預測并規(guī)劃最佳行徑路途。目前DriveGPT已經包含4000萬公里的量產車駕駛數據、1200億參數,擁有19.6億個30萬類場景標簽。DriveGPT將在今年新摩卡DHT-PHEV車型首發(fā)落地,提升HPilot高速/城市NOH安全性和流暢性。我們認為GPT大模型范式有望賦能垂直領域智能駕駛感知標注、決策推理等核心環(huán)節(jié),加速智駕落地,同時大模型研發(fā)或推動駕駛數據和算力需求快速增長。建議關注L2級自動駕駛/AI算力產業(yè)鏈。
(資料圖片)
核心觀點
DriveGPT:大模型賦能場景生成、軌跡預測、推理決策
毫末智行發(fā)布了其DriveGPT自動駕駛生成式大模型,具體邏輯:(1)感知環(huán)境離散化后作為token設計drive language;(2)輸入大量駕駛場景數據,利用transformer模型生成系列決策結果;(3)RLHF:將人工挑選困難場景Clips(數據組)輸入訓練模型,對生成結果進行最優(yōu)解排序;(4)Reward Model強化學習。DriveGPT目前可以根據歷史一段時間駕駛場景序列數據,不斷生成未來可能發(fā)生的多種駕駛環(huán)境并預測每種情況下車輛行駛軌跡。此外公司目前正設計利用prompt提示優(yōu)化輸出結果,并給DriveGPT加入思考鏈,使駕駛策略具備邏輯可解釋性,解決transformer黑盒模式潛在問題。
機會:大模型有望解決行業(yè)數據標注準確率及成本困境
視覺識別是開發(fā)大模型的基礎能力之一,識別傳感器輸入圖像中的車道線、車輛、行人、交通燈等要素并進行數據標注才能獲得大量的可用訓練數據集。我們看到DriveGPT等大模型可以很好地自動識別圖像以替代人工標注,據毫末會上表示,DriveGPT可以將交通場景圖像的標注費用從行業(yè)平均約5元/張降至約0.5元/張,計劃逐步向合作伙伴開放該服務。同時,我們認為近期Meta的CV模型SAM有望賦能自動駕駛行業(yè),SAM無需額外訓練即可自動完成分割,提升機器視覺,有利于自動駕駛可用訓練集快速積累。
挑戰(zhàn):國內AI智能駕駛大模型應用普及仍面臨數據需求和算力等挑戰(zhàn)
(1)數據:DriveGPT目前參數量約1200億,擁有約4,000萬公里的量產車駕駛數據。參考行業(yè)龍頭特斯拉2020年已有超48億公里數據,大模型賦能下我們認為國內公司或將加快智能駕駛系統量產上車步伐,加快數據搜集回饋模型訓練。(2)算力:特斯拉FSD背后擁有1.4W個GPU訓練集群;毫末建設MANA OASIS中心給DriveGPT提供67億次/秒的高性能浮點運算,2T/秒存儲帶寬,以及800G/秒通信帶寬支持;小鵬計算中心“扶搖”提供算力達600PFLOPS.大模型、大數據驅動的智能駕駛對算力提出了更高要求,有望驅動算力基礎設施需求。建議關注L2級自動駕駛/算力產業(yè)鏈。
(文章來源:證券時報)
標簽: