機(jī)器也能有閱讀理解能力?
閱讀不僅是人類(lèi)獲取知識(shí)、提高心智的重要途徑,對(duì)于機(jī)器而言,擁有
閱讀能力同樣也能夠?qū)崿F(xiàn)持續(xù)學(xué)習(xí)和進(jìn)化。機(jī)器
閱讀理解主要通過(guò)讓機(jī)器閱讀文本,然后回答和閱讀內(nèi)容相關(guān)的問(wèn)題,其中涉及到的理解、推理、摘要等復(fù)雜技術(shù),對(duì)機(jī)器而言頗具挑戰(zhàn)。
計(jì)算機(jī)文本理解能力首次超越人類(lèi)
今年1月,在機(jī)器閱讀理解領(lǐng)域頂級(jí)賽事、由美國(guó)斯坦福大學(xué)發(fā)起的SQuAD挑戰(zhàn)賽上,位列前幾名的團(tuán)隊(duì)包括微軟亞洲研究院、阿里巴巴、科大訊飛和哈工大聯(lián)合實(shí)驗(yàn)室,他們各自提交的系統(tǒng)模型先后超越了人類(lèi)解答的分?jǐn)?shù)。計(jì)算機(jī)文本理解能力在這個(gè)測(cè)試上首次超越人類(lèi),成為自然語(yǔ)言處理領(lǐng)域一個(gè)重要里程碑。
雖然目前世界機(jī)器閱讀理解的技術(shù)多集中在英文領(lǐng)域,但近年來(lái)中國(guó)研發(fā)團(tuán)隊(duì)在機(jī)器閱讀理解比賽中屢創(chuàng)佳績(jī)。在不久的將來(lái),中國(guó)人在AI(人工智能)的這個(gè)領(lǐng)域有望實(shí)現(xiàn)彎道超車(chē),達(dá)到世界頂尖水平。
該領(lǐng)域突破將反哺其他領(lǐng)域
通常,機(jī)器閱讀理解的定義是讓機(jī)器閱讀文本,然后回答和閱讀內(nèi)容相關(guān)的問(wèn)題。在微軟亞洲研究院副院長(zhǎng)、國(guó)際計(jì)算語(yǔ)言學(xué)協(xié)會(huì)(ACL)候任主席、中國(guó)中文信息技術(shù)專(zhuān)委會(huì)主任周明看來(lái),自然語(yǔ)言理解是人工智能“皇冠上的明珠”,而機(jī)器閱讀理解是自然語(yǔ)言處理中最關(guān)鍵的部分。
目前,自然語(yǔ)言處理技術(shù)在神經(jīng)機(jī)器翻譯、智能搜索、智能客服、聊天機(jī)器人甚至文藝寫(xiě)作等方面都有廣泛應(yīng)用。隨著大數(shù)據(jù)、深度學(xué)習(xí)和運(yùn)算能力的提高,機(jī)器閱讀理解水平近兩年突飛猛進(jìn),尤其是在閱讀理解評(píng)測(cè)上達(dá)到了人類(lèi)任務(wù)的標(biāo)準(zhǔn)水平。同時(shí),自然語(yǔ)言理解的突破,也將從技術(shù)上反哺圖像識(shí)別和語(yǔ)音識(shí)別等領(lǐng)域。
不過(guò),機(jī)器閱讀理解超越人類(lèi),并不能表明機(jī)器的能力就超越了人類(lèi)。機(jī)器擬合數(shù)據(jù)的能力足夠強(qiáng),但在推理、知識(shí)圖譜以及人類(lèi)通用知識(shí)和常識(shí)方面,機(jī)器的能力仍然是非常脆弱的,目前仍未解決。
中國(guó)AI發(fā)展有多方面優(yōu)勢(shì)
談到中國(guó)在人工智能領(lǐng)域的整體發(fā)展,周明認(rèn)為中國(guó)有多方面的優(yōu)勢(shì)。
首先,中國(guó)有一個(gè)清晰的藍(lán)圖,政府有明確的綱要,從政策到投資,都鼓勵(lì)人工智能的發(fā)展。
其二,中國(guó)擁有世界上最龐大的網(wǎng)民群體,無(wú)論是電子商務(wù)、搜索,還是辦公、語(yǔ)音等等,有強(qiáng)烈的用戶需求。
其三,目前的工業(yè)和產(chǎn)品都是數(shù)據(jù)驅(qū)動(dòng)的,那就意味著誰(shuí)掌握數(shù)據(jù),誰(shuí)掌握?qǐng)鼍埃揪驼莆樟酥鲃?dòng)權(quán)。現(xiàn)在中國(guó)講究數(shù)字化轉(zhuǎn)型,各行各業(yè)的需求都要數(shù)字化,數(shù)字化再往上是智能化。比如交通、醫(yī)療、教育、司法、金融等,都有大量數(shù)據(jù),這些領(lǐng)域只要把數(shù)據(jù)做好,然后加入人工智能的一些能力,就將會(huì)極大提高整個(gè)社會(huì)生產(chǎn)力。
其四,中國(guó)過(guò)去幾十年的積累,基礎(chǔ)設(shè)施都比較齊備,包括人工智能的人才儲(chǔ)備,而且將會(huì)有越來(lái)越多的投資促進(jìn)公司和高校研發(fā)力量不斷增強(qiáng)人才培養(yǎng)。
不過(guò),周明指出,中國(guó)人工智能領(lǐng)域的拔尖人才,尤其是能夠提出領(lǐng)先理念的領(lǐng)軍人物相比美國(guó)少很多。“我們一開(kāi)始可能是追隨者,但到了一定程度后,我們應(yīng)該有自信心來(lái)引領(lǐng)世界人工智能,包括自然語(yǔ)言理解的潮流。”