12月3日,2021阿里靈杰AI工程化峰會圓滿落幕。阿里巴巴集團副總裁、阿里云智能計算平臺事業(yè)部負責人、達摩院 AI 平臺負責人賈揚清,達摩院語音實驗室負責人鄢志杰,阿里云智能研究員、機器學習PAI平臺和大數據平臺技術負責人林偉等11位技術牛人亮相本次峰會,與開發(fā)者共同探討AI落地產業(yè)的路徑探索與創(chuàng)新實踐。
賈揚清:從需求視角出發(fā),擁抱云原生的AI時代
阿里巴巴集團副總裁、阿里云智能計算平臺負責人、達摩院 AI 平臺負責人賈揚清以一名AI老兵的身份,分享了經歷多次浪潮后的觀察。他把早期的AI開發(fā)人員比作“拓荒者”,身兼算法研究員、軟件工程師、數據工程師、系統(tǒng)工程師多種角色,嘗試把AI算法和應用逐漸落地。
(圖:阿里巴巴集團副總裁、阿里云智能計算平臺負責人、達摩院 AI 平臺負責人賈揚清分享“一個AI開發(fā)者的奇幻漂流”)
隨著技術發(fā)展,組件數量和模型算法的復雜度都在增加。時至今日,需要搭建一個統(tǒng)一的空間來拉通數據管理、算法迭代、模型訓練及上線各環(huán)節(jié)。賈揚清總結道,“AI的痛苦在于本質上沒有范式。AI不是一個單點的產品,而是一系列能力的組合;另一方面,AI對標準的軟件和定制化服務協(xié)同的需求極強?!?/p>
因此,“AI開發(fā)者需要的,不是從資源視角搭建起來的平臺;而是從需求出發(fā),通過云原生、容器化方式鏈接資源的平臺”,這正是打造阿里靈杰的初衷。今年10月剛剛發(fā)布的阿里靈杰,通過一體化的大數據與AI產品體系,向用戶提供10萬臺以上計算集群的彈性算力、上百種標準化算法和模型服務、以及覆蓋數據處理和機器學習全鏈路的管理能力。
簡言之,阿里靈杰的核心價值在于,幫助今天的AI開發(fā)者更好地將數據、算法和場景結合起來,構建更完整更復雜的解決方案,去解決產業(yè)中的實際問題。
阿里靈杰AI工程平臺:全鏈路提升效率
阿里云機器學習平臺PAI和大數據平臺技術負責人林偉認為,數據、計算力、和算法有機結合才能推動AI爆發(fā),阿里靈杰也基于三要素形成了獨特的思考和實踐。
第一,數據質量決定模型的高度。因此,阿里靈杰從誕生第一天起就采用大數據與AI一體化的架構,通過湖倉一體實現對多元異構數據的存儲管理,通過DataWorks和智能標注產品實現數據質量提升和監(jiān)控,通過MaxCompute、Hologres、Flink等計算引擎完成實時或離線分析處理;
第二,算法開發(fā)迭代速度是重要生產力。云原生的靈杰平臺能提供彈性的計算力,并具備良好的異構硬件和端設備適配性,能提升模型開發(fā)和部署效率。面向大模型,靈杰機器學習平臺的Whale框架可自動實現分布式訓練,FineTune框架可基于預訓練大模型蒸餾出垂直場景的小模型,提升大模型生產速度和應用價值;
第三,AI系統(tǒng)能力是核心能力。阿里巴巴集團內部AI應用需求極大,推動著靈杰機器學習平臺PAI的核心引擎不斷發(fā)展優(yōu)化,覆蓋超大規(guī)模稀疏模型訓練及服務、超大規(guī)模多模態(tài)預訓練模型、自動編譯、大規(guī)模集群調度、ML Ops等方向。
(圖:阿里云機器學習平臺PAI和大數據平臺技術負責人林偉分享AI工程化技術趨勢)
聚焦阿里靈杰的平臺產品能力,阿里云機器學習平臺PAI產品負責人黃博遠帶來了一系列新功能發(fā)布。黃博遠介紹,PAI提供從數據準備、模型開發(fā)、到模型部署、訓練的全流程平臺能力,此次產品升級主要是3個方面:
1、 AI開發(fā)全鏈路體驗提升,發(fā)布AI工作空間實現精細化的團隊開發(fā)協(xié)作和AI資產管理。
2、 PAI集成開源autoML框架NNI。PAI-DSW以jupyter插件形式集成NNI,讓自動機器學習能力變得唾手可得;PAI-DLC分布式集群可進行NNI HPO分布式訓練,提升使用效果。此外,PAI-NNI加入了剪枝、稀疏化、量化等方向的提升,讓autoML的能力更易達到企業(yè)級應用標準。
3、 基于PAI,可實現超大規(guī)模模型的構建、垂直場景小模型蒸餾、以及AI應用部署,讓AI更普惠。
從標準化AI服務到電商增長,阿里靈杰的產業(yè)化實踐
基于強大的基礎設施和工程能力,阿里靈杰在阿里內外都積累了成功案例。達摩院語音實驗室負責人鄢志杰認為,AI行業(yè)已經進入發(fā)展的“下半場”,AI+產業(yè)”將是兌現AI價值的重要途徑,AI應用將形成專業(yè)分工更精細的產業(yè)鏈生態(tài),“所有人將可使用AI,而AI也將予力所有人”。包含語音、視覺、NLP等能力在內的阿里靈杰AI開放服務正是基于這一愿景誕生,并具備開箱即用、自主定制、成本經濟的特點。
在電商領域,數據驅動下的智能無處不在。阿里巴巴技術專家郭瑞杰表示,在電商場景中,用戶除了獲取信息,還存在比對、決策、售后等多個環(huán)節(jié),鏈路更長,并且算法效果也業(yè)務價值直接相關。基于多年積累的電商智能增長工程平臺,已經上云并產品化,并在電商、零售、內容社區(qū)、音視頻領域幫助企業(yè)客戶實現用戶和收入顯著增長。
阿里云天池首屆“英特爾創(chuàng)新大師杯”頒獎
為引導開發(fā)者創(chuàng)新優(yōu)化技術解決方案,促進AI行業(yè)溝通學習,今年啟動了由英特爾主辦,阿里云天池平臺聯合計算平臺機器學習PAI承辦的第一屆“英特爾創(chuàng)新大師杯”深度學習挑戰(zhàn)賽。比賽聚焦OCR及NLP的兩個經典技術方向,通過多個實用場景面向全球廣大開發(fā)者發(fā)布算法挑戰(zhàn)。
經過數月征集和評選,“英特爾創(chuàng)新大師杯”頒獎典禮也在此次峰會舉辦。阿里巴巴集團副總裁、阿里云智能計算平臺事業(yè)部負責人、達摩院 AI 平臺負責人賈揚清,阿里云智能研究員、機器學習PAI平臺和大數據平臺技術負責人林偉,英特爾公司中國區(qū)超大云計算軟件架構總監(jiān)魏彬共同為獲獎者頒獎。
這次深度學習挑戰(zhàn)賽的順利舉行離不開英特爾第三代至強?可擴展處理器的強力支持。據英特爾公司中國區(qū)超大云計算軟件架構總監(jiān)魏彬介紹,英特爾第三代至強?可擴展處理器提供了澎湃的計算性能,不僅擁有VNNI指令集,提供強大的INT8的量化性能,還在新一代的平臺中增加了BF16的指令集,對既要求計算又要求精度的OCR以及NLP場景尤為適合;在軟件側,英特爾還在框架層面上對Pytorch Tensorflow進行了深度優(yōu)化。對本次比賽而言,選手也得以擁有良好的模型訓練和優(yōu)化環(huán)境,無論在邊緣或是云端,都能讓工作負載處于安全狀態(tài),為開發(fā)者的模型研發(fā)保駕護航。
聲明:本文為廣告信息,不代表本站觀點。如有違規(guī)或侵權,請聯系我們。