精品国产鲁一鲁一区二区在线观看_啦啦啦在线视频免费观看www_野战视频在线看_一区二区精品免费观看_91亚洲蜜臀精品国产_午夜视频一区二区免费久久_国产 欧美 日韩 精品_熟妇人妻va精品中文字幕

國家市場監(jiān)督管理總局主管

中國消費者協(xié)會主辦

維護(hù)消費者合法權(quán)益,引導(dǎo)消費者合理消費

當(dāng)前位置:首頁 > 科技
中文自然語言處理數(shù)據(jù)共建讓機(jī)器讀懂“千言”
2020-08-26 16:18 本文來源:中國消費者報•中國消費網(wǎng) 作者:武曉莉
 

   “機(jī)器人保姆要想真正走入家庭,自然語言是第一關(guān)。”達(dá)闥科技總裁黃曉慶在此前的一次座談上對記者說。
   自然語言理解(NLP)素有“人工智能皇冠上的明珠”的盛譽,語言與知識技術(shù)是人工智能認(rèn)知能力的核心。這也意味著語言與知識等認(rèn)知層面的技術(shù)突破,將進(jìn)一步促進(jìn)AI深入發(fā)展。
   中文作為最優(yōu)美、最復(fù)雜的語言,其自然語言的數(shù)據(jù)共建將幫助機(jī)器讀懂“千言”,開拓人工智能領(lǐng)域無限的遐想空間。
  機(jī)器認(rèn)知需依賴知識圖譜
  
“知識圖譜是機(jī)器認(rèn)知世界的重要基礎(chǔ)。”在剛剛結(jié)束的以“掌握知識、理解語言、擁有智能”為主題的百度大腦語言與知識技術(shù)峰會上,百度CTO王海峰解讀了語言與知識技術(shù)的發(fā)展歷程與最新成果,與產(chǎn)學(xué)研各界分享技術(shù)及產(chǎn)業(yè)發(fā)展趨勢和展望。
   基于最大的搜索平臺的數(shù)據(jù)優(yōu)勢,百度打造了世界上最大規(guī)模的知識圖譜,擁有超過50億實體和5500億事實,并在不斷演進(jìn)和更新。該知識圖譜應(yīng)用于各行各業(yè),每天的調(diào)用次數(shù)超過400億次。
   在融入知識的基礎(chǔ)上,機(jī)器的語言理解能力不斷增強。通過知識增強的語義理解框架ERNIE,在深度學(xué)習(xí)的基礎(chǔ)上融入知識,同時具備持續(xù)學(xué)習(xí)能力,這讓機(jī)器自然語言突破了閱讀理解、對話理解以及跨模態(tài)深度語義理解等技術(shù)。
   語言生成是語言與知識技術(shù)中的重要組成部分?;陬A(yù)訓(xùn)練技術(shù)的成功經(jīng)驗提出的基于多流機(jī)制的語言生成預(yù)訓(xùn)練技術(shù),兼顧詞、短語等不同粒度的語義信息,顯著提升生成效果。
   在應(yīng)用系統(tǒng)層面,對話系統(tǒng)和機(jī)器翻譯等成績卓著。提出了知識圖譜驅(qū)動的對話控制技術(shù),以及首個基于隱空間的大規(guī)模開放域?qū)υ捘P蚉LATO等,并推出智能對話定制和服務(wù)平臺UNIT,幫助開發(fā)者高效構(gòu)建智能對話系統(tǒng),實現(xiàn)規(guī)?;瘧?yīng)用。
   通過上述技術(shù),機(jī)器翻譯也取得了突破性進(jìn)展。以百度為例,其翻譯支持200多種語言,每天響應(yīng)超過千億字符的翻譯請求,支持超過40多萬家第三方應(yīng)用,技術(shù)上,提出了多智能體聯(lián)合學(xué)習(xí)、基于語義單元的同傳模型、稀缺語種分組混合訓(xùn)練算法等。
   王海峰認(rèn)為,人工智能大腦語言與知識技術(shù)的持續(xù)探索和創(chuàng)新,以平臺化的方式輸出,可以賦能千行萬業(yè),持續(xù)提升產(chǎn)業(yè)智能化水平。
   此次大會還發(fā)布了百度大腦語言與知識產(chǎn)品全景圖,以及語義理解技術(shù)與平臺文心、智能文檔分析平臺TextMind和AI同傳會議解決方案三大新產(chǎn)品和6項升級。
  語言與知識技術(shù)平臺化
  
只用一臺電腦和一部手機(jī),就可以在大型會議現(xiàn)場快速搭建一套同傳系統(tǒng),只需點點鼠標(biāo)、打幾個字,就能快速獲得專業(yè)的同傳服務(wù)。
   語言與知識技術(shù)平臺化可以在應(yīng)用中產(chǎn)生大量價值,為廣大開發(fā)者和產(chǎn)業(yè)實踐者提供以語言與知識技術(shù)為核心驅(qū)動的系列產(chǎn)品。
   據(jù)百度集團(tuán)副總裁吳甜介紹,語義理解技術(shù)與平臺文心,基于深度學(xué)習(xí)平臺飛槳打造,依托領(lǐng)先的語義理解核心技術(shù),集成優(yōu)秀的預(yù)訓(xùn)練模型、全面的NLP算法集、端到端開發(fā)套件和平臺,提供一站式NLP開發(fā)與服務(wù),讓開發(fā)者更簡單、高效地定制企業(yè)級NLP模型。文心經(jīng)過了大量真實應(yīng)用場景的淬煉,已經(jīng)具備優(yōu)秀的工業(yè)級落地實力。
   智能文檔分析平臺TextMind,具備“多快好省”的核心優(yōu)勢,可以促進(jìn)企業(yè)辦公智能升級。
   利用機(jī)器大腦智能創(chuàng)作平臺,媒體應(yīng)用場景也得到再升級。智能策劃、智能采編、智能審校三大媒體場景方案,可以進(jìn)一步助力媒體人更快、更好地創(chuàng)作。
   智能對話定制與服務(wù)平臺UNIT,有更智能的任務(wù)式對話理解、極致便捷的表格問答和融合通用的新對話引擎。將進(jìn)一步降低任務(wù)式對話、智能問答的定制成本,并融合通用對話能力,提升交互體驗。
   上述AI同傳會議解決方案,覆蓋了會議全場景、全流程,旨在打造用戶隨身的“會議同傳專家”。
   所有的場景都離不開數(shù)據(jù)計算,更多的數(shù)據(jù)集作者參與共建,可以共同推動中文信息處理技術(shù)的進(jìn)步,建設(shè)世界范圍的中文信息處理影響力。據(jù)了解,未來3年,中文自然語言處理數(shù)據(jù)共建計劃——“千言”將面向20多個任務(wù),收集和建設(shè)不少于100個中文自然語言處理數(shù)據(jù)集,覆蓋語言與知識技術(shù)全部領(lǐng)域。
   未來,機(jī)器將更好地理解世界、更好地服務(wù)于人。

 

責(zé)任編輯:40
赤城县| 荆州市| 上饶县| 光泽县| 西充县| 吉隆县| 万山特区| 日喀则市| 喀什市| 寿宁县| 龙泉市| 瑞昌市| 靖远县| 海口市| 安龙县| 安乡县| 普格县| 周宁县| 商洛市| 什邡市| 隆回县| 寿光市| 大连市| 东乡| 德钦县| 漯河市| 乌审旗| 高要市| 耿马| 西丰县| 会宁县| 泊头市| 玉林市| 黑龙江省| 天镇县| 松潘县| 来安县| 麦盖提县| 江永县| 崇左市| 买车|