當(dāng)前位置: 首頁 > 工業(yè)控制產(chǎn)品 > 自動(dòng)化控制 > 人工智能
發(fā)布日期:2022-10-09 點(diǎn)擊率:82
來自南京工業(yè)大學(xué)的宋昊旻用聽上去有些蹩腳的普通話,在微軟人工智能大會的舞臺上,跟微軟全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負(fù)責(zé)人沈向洋進(jìn)行對話的時(shí)候,現(xiàn)場很多人都非常感動(dòng)。對于一個(gè)雙耳失聰?shù)娜藖碚f,只要拿著一部手機(jī),就可以跟人正常交流,是多么難的一件事。我們不會手語,而他們聽不到聲音,而我們和他們之間的鴻溝,現(xiàn)在只要有一部手機(jī)就幫助宋昊旻跟正常人溝通,甚至可以跟外國人交流了。
圖:宋昊旻(右)與微軟全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負(fù)責(zé)人沈向洋(左)
解決宋昊旻的溝通問題,可能只是我們看到的其中一個(gè)小例子,幫助人類解決更多語言的問題,才是人工智能的專家們孜孜以求的目標(biāo)。微軟云與人工智能事業(yè)部全球資深技術(shù)院士兼首席語音科學(xué)家黃學(xué)東,正在微軟領(lǐng)導(dǎo)語音技術(shù)和語言翻譯工作,他們的工作就是想解決這些問題。
從感知到認(rèn)知
二十幾年前的時(shí)候,沒有GPU,沒有DSP、TMS320……,那個(gè)時(shí)候的黃學(xué)東是不敢想象,計(jì)算機(jī)語音識別、語音合成能達(dá)到可以媲美人類的水平,到今天來看,這已經(jīng)是很了不起的成就,是令語音識別這個(gè)領(lǐng)域的人值得驕傲的成績。
圖:微軟云與人工智能事業(yè)部全球資深技術(shù)院士兼首席語音科學(xué)家黃學(xué)東
從整個(gè)人工智能的發(fā)展水平來看,這是人工智能在感知層面的一大步。
不管是語音識別也好,計(jì)算機(jī)視覺也罷,都屬于“感知”層面,感知智能因?yàn)樯疃葘W(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)的發(fā)展,獲得了突破性的成果。但是在認(rèn)知層面,進(jìn)步還是有限的。
我們當(dāng)前看到的機(jī)器翻譯,實(shí)際上是處于感知到認(rèn)知之間的過程,它可以“假裝”聽懂,來做翻譯工作,而且翻譯出來的效果還不錯(cuò),但實(shí)際上,它并沒有聽懂。
今年,黃學(xué)東帶領(lǐng)團(tuán)隊(duì)在中英文新聞翻譯任務(wù)(WMT-2017)上首次實(shí)現(xiàn)了可以媲美人類的機(jī)器翻譯歷史性突破,這是非常有歷史性意義的事實(shí)。語音和語言是人類進(jìn)化中重要的要素,而現(xiàn)在,計(jì)算機(jī)第一次在翻譯質(zhì)量上超過專業(yè)人士的水平,這對人類文明的進(jìn)展來說,都很有里程碑意義。
所謂“認(rèn)知”包括上下文推理,真正的自然語言處理,而這方面還需要更長的路要走,那才是人工智能真正的皇冠,我們現(xiàn)在還沒有達(dá)到,也不知道什么時(shí)候達(dá)到。
可以想象一下,如果有一天,機(jī)器可以理解我們所有的文本,了解上下文,有推理的功能,這意味著機(jī)器可以24小時(shí)閱讀所有的新聞,所有出版過的文件、著作、科學(xué)文獻(xiàn),那是真正的“上知天文下知地理”,還有生物等等各個(gè)學(xué)科的知識,那個(gè)時(shí)候的機(jī)器比愛因斯坦,因?yàn)閻垡蛩固挂彩侵欢锢?,那個(gè)時(shí)候,才是真正的“強(qiáng)人工智能”的來臨。
強(qiáng)人工智能,一定是有自然語言理解,由感知驅(qū)動(dòng)的,讓計(jì)算機(jī)能達(dá)到人的知識獲取能力,可以通過閱讀自動(dòng)獲取知識。過去5000年人類的所有文獻(xiàn),它都可以讀得一個(gè)字不忘,還有超過人類的深入理解。
比如說,今天,我們引用《封神演義》里的一句:眼觀六路、耳聽八方,其實(shí)《封神演義》里面講的不是六路,是眼觀四路、耳聽八方。如果計(jì)算機(jī)在自然語言處理上進(jìn)步了,機(jī)器就可以指出“眼觀六方”是不對的,《封神演義》講的是四方,不是六方。
智能音箱、翻譯機(jī)開始“感知”
當(dāng)然,讓黃學(xué)東感到遺憾的是,以目前的技術(shù)能力和水平,還不知道什么時(shí)候能夠?qū)崿F(xiàn)真正的“強(qiáng)人工智能”。但好消息是,在從感知到認(rèn)知的過程中,我們已經(jīng)有了一步一步的成績。
黃學(xué)東強(qiáng)調(diào),語音技術(shù)是一個(gè)賦能的技術(shù),所有的開發(fā)者都可以把這個(gè)技術(shù)拿過來,實(shí)現(xiàn)自己想要做的東西,比如智能音箱和翻譯器的火爆,是兩個(gè)很好的案例。
“現(xiàn)在遠(yuǎn)場語音識別能力已經(jīng)很強(qiáng),所以音箱火得不能再火了,智能音箱也成為今年CES展上的重頭戲。音箱出現(xiàn)很重要的一個(gè)原因就是,語音識別技術(shù)進(jìn)步到了這個(gè)水平,遠(yuǎn)場交互都已經(jīng)達(dá)到了可用的水平,所以促使了智能音箱市場的火爆?!?/p>
今年另一個(gè)熱門產(chǎn)品翻譯器,尤其在中國,是一個(gè)很大的市場。中國每年有1.2億的游客出去,微軟跟小米生態(tài)鏈企業(yè)香蕉出行合作推出的魔芋AI翻譯機(jī),能夠提供覆蓋全球170多個(gè)國家和地區(qū)的14種語言的實(shí)時(shí)語音翻譯,而且物美價(jià)廉,常常是脫銷狀態(tài)。
從翻譯的質(zhì)量來看,目前的翻譯機(jī)也是不遜色的。翻譯滿分是100分的話,微軟最新的機(jī)器翻譯系統(tǒng)已經(jīng)達(dá)到了69分,可以媲美人類。機(jī)器翻譯不像語音識別只有唯一的答案,機(jī)器翻譯是有很多種答案的,評價(jià)機(jī)器翻譯的時(shí)候,現(xiàn)在只能靠人為判斷?,F(xiàn)有的商用系統(tǒng)中,微軟和谷歌在標(biāo)準(zhǔn)的測試集上,得分分別在56分、54分左右,在微軟有最新突破之前,國內(nèi)的搜狗公司達(dá)到了62分的水平。
然而當(dāng)翻譯機(jī)火爆的時(shí)候,人工智能威脅說也隨之愈演愈烈,人工智能會取代翻譯的說法也鋪天蓋地。
但黃學(xué)東覺得,目前機(jī)器翻譯取代人類還為時(shí)尚早,機(jī)器翻譯出錯(cuò)誤會出得比人類更離譜,最好的方法就是在機(jī)器轉(zhuǎn)錄翻譯的時(shí)候,有人在旁邊看著,有錯(cuò)誤就給糾正一下,人和機(jī)器協(xié)同工作,這是最好的模式。
因?yàn)樵诔霈F(xiàn)冷僻的詞、新的概念的時(shí)候,機(jī)器往往會出錯(cuò)。人可以實(shí)時(shí)學(xué)習(xí)冷僻的詞和新的概念,這里面實(shí)際上包含很大的信息量,人類馬上可以自適應(yīng),可以舉一反三,而機(jī)器就做不到。怎么樣處理沒有見過的事情,這才是真的智能,也是人類智能和機(jī)器智能最大的區(qū)別。
“如果是沒有突發(fā)事件,那么是基本可信、基本可達(dá)、基本還算比較雅。如果出現(xiàn)突發(fā)事件,就舉一不可反三,這是人工智能和人的智能最大的差距?!?/p>
下一篇: PLC、DCS、FCS三大控
上一篇: 索爾維全系列Solef?PV