《百度公布“新十大發明”:打造AI內容生產神器、升級無人車避障能力》
9月20日,百度首次發布“2022十大科技前沿發明”,披露高價值專利成果,多項人工智能、自動駕駛專利技術全球領先。跨模態通用可控AIGC(基于人工智能的內容生成)發明,全球首次實現語言與視覺大一統的理解與生成,登頂多個國際權威榜單;無人車多傳感器融合處理系統,有效支撐百度Robotaxi應對各種城市復雜道路;知識增強大模型鵬城-百度·文心是目前全球最大中文單體模型,具備超強的語言理解能力和文學創作能力。
北京市知識產權局副局長李鐘表示,近年來,我國把科技創新作為引領發展的第一動力,深入實施創新驅動發展戰略,開啟了建設世界科技強國的新征程。關鍵核心技術專利是國之重器,“十大科技前沿發明”成果體現了百度多項國際前沿核心技術的實現與突破,對推動經濟發展和技術進步有著十分重要的意義。
“十大科技前沿發明”中的跨模態通用可控AIGC,在通用性上提出了跨模態、跨任務的統一建模技術,是全球首次實現語言與視覺大一統的理解與生成,登頂VQA、VCR、aNLI三大國際權威榜單。AIGC被認為是顛覆現有內容生產方式的新一代技術。AI作畫就是AIGC的一種,它可以實現以十分之一的成本,以百倍千倍的生產速度,創造出有獨特價值和獨立視角的內容。
AIGC背后是預訓練大模型創新的突破。早在2019年3月 百度發布了國內首個開源預訓練模型文心ERNIE 1.0。目前,百度文心已經升級成為產業級知識增強大模型家族,涵蓋以鵬城-百度·文心為代表的語言大模型、計算機視覺、跨模態、生物計算領域的大模型,以及電力、金融、航天等行業大模型,能夠從大規模知識和海量數據中融合學習,效率更高、效果更好,具備領先的理解和生成能力。

百度CTO王海峰表示,百度是領先的AI公司,一方面要在科技前沿領域加緊創新和探索,攻關核心關鍵技術,把發展主動權掌握在自己手里;另一方面,將創新成果與產業融合,促進產業發展,助力高水平科技自立自強。經過二十多年的持續創新投入,百度產出了很多創新成果,引領技術和產業發展方向。百度人工智能技術,全面應用于搜索、信息流以及地圖、翻譯、輸入法、小度智能硬件等產品,助力智能駕駛持續創新,并通過百度智能云輸出給各行各業,推動千行百業的數字化轉型和智能化升級。
資料顯示,百度是中國最早布局自動駕駛的企業,技術、運營、產品等成績世界領先。無人車多傳感器融合處理系統專利組合的感知技術目前已經在自動駕駛車輛上得到大規模應用,實測效果漏檢率總計減少60%,低矮障礙物漏檢率減少83%,有效支撐百度Robotaxi在各種城市復雜道路和場景上無人駕駛能力的構建。
“十大科技前沿發明”是百度創新投入的一個縮影。截至2022年,百度已在人工智能領域深耕整十年,累計研發投入超1000億元。百度連續四年在AI專利申請量和授權量方面蟬聯中國第一。2021年,百度深度學習專利申請量、自動駕駛專利族數量均排名全球第一,并榮獲人工智能交互領域的唯一中國專利金獎,成為人工智能領域獲得中國專利獎獎項最多、獲獎級別最高的高科技企業。
活動現場,百度還為眾多高質量專利進行了嘉獎。其中,“基于人工智能的人機交互方法和系統”,榮獲第二十二屆中國專利金獎,是迄今為止中國智能交互領域唯一的專利金獎。該專利技術運用知識圖譜及深度學習等技術,以深度語義理解為基礎,實現了跨越語言、語音、圖像等模態的智能人機交互。“基于弱監督的字符檢測器訓練方法”,榮獲第二十三屆中國專利銀獎,這是目前OCR光學字符識別領域唯一的專利獎項,實現了全場景覆蓋、超高精度的光學字符檢測。
百度資深副總裁、總法律顧問梁志祥稱,百度從成立之日起,就高度重視自主創新和專利保護,銖積寸累,建立了完備的知識產權保護機制,激勵創新推動高質量知識產權創造。以技術創新為信仰,以專利保護為保障,百度積累了量、質領先的人工智能專利,構建了全新的人工智能產業知識產權運營生態。隨著知識產權保護的全面加強,百度領先的人工智能專利正在持續釋放價值,支撐公司的產品和業務發展,賦能千行百業,為中國人工智能產業發展提供自主可控的知識產權驅動力。百度發布科技前沿發明,希望與產業伙伴分享百度的前沿創新成果,共同推動中國數智產業高質量發展。
2022十大科技前沿發明,具體如下:
1.跨模態通用可控AIGC
該發明在業界首次提出語言與視覺統一的理解與生成模型,創新提出融合知識的生成,突破了通用可控內容生成技術瓶頸,實現了文本生成、圖像生成、視頻生成、數字人生成的實用化跨越。發明已落地業界首創的圖文轉視頻、高精度數字人生成、文生圖等創新產品,大幅提升了內容生產效率,開創了AI內容生成的新篇章。
2.無人車多傳感器融合處理系統
該項發明以多傳感器融合為核心,完善激光雷達感知能力,構建了環視視覺的獨立閉環能力,已經在自動駕駛車輛上得到大規模應用,實測效果漏檢率總計減少60%,低矮障礙物漏檢率減少83%,有效支撐百度Robotaxi在各種城市復雜道路和場景上無人駕駛能力的構建。
3.知識增強大模型
該發明是百度文心大模型的核心技術,其從大規模知識和海量數據中融合學習,具備領先的理解和生成能力。包括了以全球首個千億級知識增強大模型鵬城-百度·文心為代表的語言大模型、計算機視覺、跨模態等大模型,以及電力、金融、航天等行業大模型,在百余權威任務取得最好效果,目前已大規模應用于百度的各類產品,顯著提升各類產品體驗,并通過飛槳和百度智能云支持各行各業的產業智能化升級。
4.深度學習通用異構參數服務器架構
該項發明通過可擴展的架構設計,不僅可以支持基于CPU、GPU、XPU等不同類型硬件的參數服務器架構單獨訓練,還可以通過強化學習算法將同一深度學習模型訓練任務分配到不同類型硬件的計算節點上進行混合硬件異構訓練,實現計算資源最優搭配,從而可減少50%以上的深度學習模型訓練成本,有效提升深度學習模型訓練效率。
5.基于AI的生物計算平臺PaddleHelix
該發明提出了一系列基于AI的生物計算創新技術,包括自主研發的高效mRNA疫苗設計LinearDesign算法,全球首個基于幾何空間構象的化合物表征模型HelixGEM,端到端的單序列蛋白結構預測模型HelixFold-Single等,大幅提升了新藥研發和疫苗設計效率,助力科技抗疫。
6.面向自動駕駛的車路協同關鍵技術
該項發明構建了車路協同自動駕駛的復雜技術體系與融合協同機制,通過協同感知,解決自動駕駛動靜態盲區、超視距、遮擋等一系列感知長尾問題,通過協同決策規劃和協同控制解決混行狀態下的現實變更、博弈、阻塞和極端場景等問題,降低自動駕駛的接管次數和安全事故風險,保障自動駕駛安全連續運行。
7.全平臺量子軟硬一體
該發明圍繞“量羲”布局,“量羲”是百度推出的基于“乾始”研發的全球首個全平臺量子軟硬一體化解決方案,提供私有化部署、云服務、硬件接入等一系列服務,最大程度上簡化了量子硬件部署到量子服務的全流程。“量羲”具備適配超導、離子阱等多類型主流量子芯片,可實現量子芯片“即插即用”。
8.數字人智能化生產
該發明基于語音、語義和視覺等AI技術,以智能終端為載體,實現人機可視化語音交互服務。借助百度智能云曦靈平臺,打通數字人生產、人設管理、內容創作到業務編排全流程。結合UNIT7.0跨模態對話引擎及AIGC技術,支持服務型和演藝型數字人多種人像(2D、3D、卡通)高效生產及運營。
9.智慧城市全要素雙總線技術
該發明的全要素雙總線包含智慧總線與知識總線,智慧總線構建城市服務的全資源協同開發與運行環境,統一納管調度城市中的各類數據、算法、算力,為智能化應用開發提供綜合技術供應;知識總線依托文心增強的城市多模態大模型及知識圖譜、NLP等AI技術,搭建城市全要素融合知識圖譜,支撐跨部門、跨應用、跨數據間的知識體系打通和資源共用。
10.自動駕駛多模態行人運動預測
該發明提出一種融合多模態輸入特征以及多維度交互模式的深度學習模型,用于預測行人未來6s的運動軌跡,已在Robotaxi業務中落地應用,行人預測準召提升30%,VRU碰撞風險問題解決率95%。