來源:TECH2IPO/創見
7 月 4 日召開的百度 AI 開發者大會(Baidu Create 2018)上,百度高級副總裁、AI 技術平臺體系(AIG)總負責人王海峰發布百度大腦 3.0,并指出,百度大腦 3.0 的核心是「多模態深度語義理解」,包括數據的語義,知識的語義,以及圖像、視頻、聲音、語音等各方面的理解。
從「看清聽清」到「看懂聽懂」
「多模態深度語義理解能讓機器聽清、看清,更能深入理解它背后的含義,深度地理解真實世界,進而更好地支撐各種應用。」王海峰表示。
視覺語義化可以讓機器從看清到看懂視頻,并提煉出結構化語義知識。百度視覺技術部、人臉技術部、增強現實技術部總監吳中勤介紹,視覺語義化技術首先識別人、物體和場景,同時捕捉它們之間的行為和關系,通過時序化、數字化、結構化的方式形成語義知識,最終結合領域和場景進行智慧推理,落地行業應用。比如在零售領域,它可以準確判斷每個人的動作、行為,真正實現顧客拿起商品就走。未來,視覺語義化技術還可進一步延展,它結合新型的傳感器和 AI 芯片,可以在感知層面和計算層面得到大幅提升;結合手機可以帶給用戶更佳地使用體驗。未來,百度視覺語義化技術將在百度 AI 開放平臺中開放給開發者使用。
語音技術的升級則讓機器更好地聽懂世界。百度語音技術部總監高亮表示,百度基于遠場的語音語義一體化技術取得重大突破,為業界提供更頂尖的遠場語音技術。語音語義一體化將遠場交互中高頻 Query 識別準確率提升 10 個點,并保持普通 Query 識別率不降;多語種混合聲學建模基于 Deep Peak2 大幅提升中英文混合 Query 識別準確率,相對錯誤率比業界最好競品降低 20%;新升級的 TTS 技術業界首創傳統拼接技術與 Wavenet 技術融合方案,保證合成質量的同時大大降低成本,讓大規模應用落地成為現實。此外,百度重磅發布遠場語音技術低成本解決方案「度小云」,它基于 Deep Peak V2 語音識別技術、語音語義一體化技術及 LSTM-VAD 深度學習語音切分技術,實現業界領先的五級喚醒技術,并擁有基于 Wavenet 的精致音庫,支持遠場優化的音頻通信技術。未來開發者可以平等便捷地一站式獲取百度遠場語音能力。
想要讓機器像人一樣擁有智能,將語言變成知識必不可缺。百度 AI 技術平臺體系執行總監吳甜表示,百度自然語言處理技術經過多年的發展,已形成全面、前沿的格局。百度知識圖譜已發展為復雜、多元、全面的多元語義知識圖譜,包含實體圖譜、行業圖譜、事件圖譜、關注點圖譜、多媒體圖譜,其中實體圖譜已經能夠覆蓋通用需求中 90% 的實體及其屬性。在閱讀理解技術上,百度大腦已經閱讀了千億量級的文章,相當于 6 萬個中國國家圖書館的藏書,并由此積累了億級實體、千億事實的知識,并通過「學習」真實應用每天產生的知識不斷優化。在對話理解方面,百度理解與交互技術平臺 UNIT 升級至 2.0,進一步增強冷啟動能力,支持像人類一樣在對話當中學習,同時開放了第一個工業級對話系統開源框架,降低搭建門檻,讓開發者無縫對接云端。百度將持續開源新的技術,提供更靈活便捷的方案,推動自然語言理解技術的創新與發展。
夯實基礎:數據、算法、算力并駕齊驅
數據、算法、算力是影響人工智能技術發展的重要因素。主論壇中,王海峰表示百度大腦 3.0 首次將芯片納入技術體系,帶動百度大腦算力爆發式增長。百度自主研發的中國第一款云端全功能 AI 芯片「昆侖」也在會上首次亮相。未來,AI 芯片將與百度自主研發的 PaddlePaddle 深度學習框架相結合,推動 AI 行業生態快速發展。
百度在 2016 年正式開源的 PaddlePaddle,是最適合中國開發者的深度學習框架。主論壇中,王海峰發布 PaddlePaddle3.0,下午,百度 AI 技術生態部總經理喻友平對此進行了詳細解讀。PaddlePaddle3.0 包括完整的核心框架,以及 AI Studio、AutoDL、EasyDL 等可以讓開發者平等便捷獲取頂尖 AI 能力的平臺。PaddlePaddle3.0 核心框架對服務器版本以及移動端版本進行了全面優化,PaddlePaddle Fluid 提供豐富的滿足常見主流模型搭建需求的 API,支持廣泛的模型搭建,訓練 Runtime 可以滿足各類型的模型訓練需求;PaddlePaddle Serving 可靈活適配多種預測引擎;PaddlePaddle Mobile 集成百度移動端預測的實踐經驗,提供多平臺支持。
PaddlePaddle3.0 中,AutoDL 備受關注。百度大數據(北京)實驗室主任浣軍介紹,AutoDL 能更高效自動搜索神經網絡結構,開發者無需特殊硬件設備可以快速得到高質量模型。AutoDL 提供多種能力,支持設計全新深度學習網絡結構,以及優化現有深度學習網絡結構及參數,同時能夠適配特定任務場景。
海量數據爆發式增長,發掘數據價值成為眾多行業的普遍需求。百度大數據部總監郭謝表示,百度已形成從數據到數據工程、數據科學、數據產品再到行業方案的大數據產品技術棧,基于大數據特性,從生產資料和生產工具兩方面促進產業發展。為了最大程度保證數據安全,百度正式發布大數據眾智開放平臺「點石」,基于全球領先的百度 AI 技術,全方位保障數據安全,并逐步開放工具能力,為行業數據安全賦能。
現場,百度啟動了多項大賽。百度之星開發者大賽將如期回歸,此外還有基于 PaddlePaddle 的中國高校計算機大賽人工智能創意賽、KG-知識抽取賽、交通預測賽、無人車系列大賽,以及商家招牌的分類與檢測、人工智能加速器應用與設計等大數據比賽。百度方面表示,歡迎各路高手挑戰,通過大賽攜手推動整個 AI 產業的發展。
業內人士評價,百度在推動技術落地的同時不斷反哺技術升級,如今已成為國內人工智能領域的領航者。百度大腦升級至 3.0,也標志著百度 AI 技術的一次跨越式升級,正如王海峰在開場中所強調,「百度 AI 能力的核心是百度大腦,百度大腦 3.0 是百度 AI 能力的集大成者。」。基于百度大腦持續突破的技術實力,百度有能力把頂尖的 AI 技術提供給中國開發者、企業,更讓每個開發者和企業都能平等獲取頂尖 AI 能力,繼而讓 AI 在中國遍地開花。