語言是人類區別于其他生物的最重要特征之一。自然語言處理,研究利用計算機理解并運用人類語言的理論和方法,涉及計算機科學、語言學、認知科學等多種學科,是人工智能領域的關鍵核心技術,具有重大研究和應用價值。
工程研究中心在自然語言處理技術創新和應用方面取得豐碩成果:突破知識增強深度語義理解技術,發布了系列知識增強大模型,包括在GLUE排行榜上以世界上首個超過90分的成績奪冠的ERNIE、首個知識增強千億模型ERNIE-Titan,以及首個大規模隱變量對話模型PLATO和支持200多種語言互譯、日均翻譯量超千億字符的神經網絡翻譯系統,等等;領先的自然語言處理技術支撐搜索引擎升級為智能搜索,支撐智能推薦、智能交互、地圖等為用戶提供更優服務和體驗,同時也在制造、能源、金融、媒體、政務等領域發揮價值,助力智能化升級。
未來工程研究中心以自主知識產權的深度學習框架為基礎,依托高質量大規模數據和多源異構知識圖譜優勢,面向真實豐富的產業化應用場景,在知識增強語義理解、開放域人機對話、多語言機器翻譯、高精度深度問答、智能化語言生成等領域開展研究,推動技術不斷進步和實現大規模產業化應用。