盡管谷歌的人工智能系統(tǒng)AlphaGo贏下人類棋手已經(jīng)過去半年時(shí)間,但人工智能的熱度仍在持續(xù)上升。企業(yè)間的并購、頂尖大學(xué)推出的人工智能百年報(bào)告、各國政府參與政策制定等,無不說明人工智能是下一個(gè)風(fēng)口。
Narrative Science數(shù)據(jù)統(tǒng)計(jì),截至2016年6月,人工智能領(lǐng)域已獲9.74億美元的投資,大概率超過2015年全年的12億美元。另據(jù)Crunchbase近日發(fā)布人工智能初創(chuàng)公司25強(qiáng)榜單,中國在AI初創(chuàng)企業(yè)排行榜中實(shí)力最強(qiáng),中國排名第二。
在資本的夾持下,許多公司紛紛貼上了人工智能的概念,許多人工智能公司的估值也水漲船高。作為國內(nèi)最早一批布局人工智能領(lǐng)域的公司,科大訊飛以語音起家,其輪值總裁自信地認(rèn)為語音仍是未來人工智能應(yīng)用的切入口,未來的人工智能戰(zhàn)略也圍繞語音展開。
“任何人工智能的發(fā)展都不是一蹴而就的,需要厚積薄發(fā)。它有一個(gè)持續(xù)不斷地漸進(jìn)式改變過程。”科大訊飛輪值總裁、訊飛研究院院長胡郁在接受澎湃新聞(www.thepaper.cn)專訪時(shí)說。
什么樣的公司能稱為人工智能公司?
在人工智能概念引爆全球的情況下,許多公司都紛紛開始套上了人工智能、機(jī)器人的概念。在胡郁看來,市場上并不是所有人工智能公司都可以稱為真正的人工智能公司。
“人工智能重新得到大眾的普遍關(guān)注,對于這個(gè)產(chǎn)業(yè)是個(gè)促進(jìn)。但是過分地夸大人工智能的作用,提高了大家的預(yù)期,這個(gè)對于人工智能研究和產(chǎn)業(yè)反而是不利的。”胡郁告訴澎湃新聞(www.thepaper.cn)。
在許多機(jī)器人大會(huì)上,產(chǎn)商展示的產(chǎn)品并不那么智能。一塊觸摸屏、一個(gè)攝像頭、一個(gè)耳麥、一對輪子就能拼湊成一個(gè)機(jī)器人。這樣的發(fā)展,顯然對于整個(gè)行業(yè)的發(fā)展是不利的。
胡郁告訴澎湃新聞,他認(rèn)為判斷一家公司是否是真正的人工智能公司,主要看兩個(gè)方面。一是真正擁有人工智能的技術(shù),比如認(rèn)知能力,感知能力和運(yùn)算能力。二是用人工智能的思維和方法來解決問題。
從成立科大訊飛研究院到與世界各地高校合作,科大訊飛認(rèn)為人類要達(dá)到人工智能,需要經(jīng)過三個(gè)階段的智能。分別是感知智能,運(yùn)算智能和認(rèn)知智能。目前,科大訊飛的業(yè)務(wù)并未涉及到運(yùn)算智能。在感知智能上,科大訊飛主要圍繞語音輸入和語義理解布局;認(rèn)知智能上,科大訊飛在2014年推出了“訊飛超腦”計(jì)劃。
在海外公司都在爭相購買人工智能公司的同時(shí),科大訊飛也在布局。據(jù)胡郁介紹,目前科大訊飛投了一家國內(nèi)做人工智能芯片的公司。這家公司的創(chuàng)始人均是中國科學(xué)技術(shù)大學(xué)少年班的畢業(yè)生。
“人工智能芯片是載體,可以極大地降低人工智能算法的功耗,促進(jìn)技術(shù)的普及,我覺得這是一個(gè)方向,所以我們這也算是提前布局。”胡郁說。
以語音切口,布局人工智能的醫(yī)療、法律、教育領(lǐng)域
從語音起家,科大訊飛在語音識別和語義理解上的多年積累。也讓胡郁看到了公司的信心。“語音和語言是我們的核心人工智能技術(shù),現(xiàn)在我們正在逐漸圍繞這兩個(gè)展開自己的業(yè)務(wù),比如醫(yī)療、法律。”胡郁說。
語音識別
斯坦福大學(xué)在今年8月底出的人工智能百年報(bào)告中,曾預(yù)言醫(yī)療、教育、法律等領(lǐng)域的人工智能應(yīng)用,在2030年會(huì)得到巨大的發(fā)展,是值得關(guān)注的重點(diǎn)領(lǐng)域。
在法律方面,據(jù)澎湃新聞了解,科大訊飛目前已經(jīng)做到和部分法院合作,處理庭審案件的語音錄入。此外,訊飛的人工智能系統(tǒng)正在學(xué)習(xí),有望在未來輔助法官判案。“對于老百姓來說,當(dāng)你跟他說可以向人員咨詢的時(shí)候,他可能不會(huì)輕易相信,認(rèn)為不公正。但如果是人工智能系統(tǒng),由機(jī)器來判斷,會(huì)衡量地更準(zhǔn)確些。”胡郁說。
在醫(yī)療方面,科大訊飛也在推進(jìn),目前已經(jīng)和北京、安徽的醫(yī)院建立合作。比如北京的協(xié)和醫(yī)院,科大訊飛的系統(tǒng)可根據(jù)病人的描述來判斷病情,同時(shí)通過圖像識別技術(shù)來判斷病人是否得癌癥。
教育領(lǐng)域一直是科大訊飛的優(yōu)勢。據(jù)胡郁介紹,目前科大訊飛教育業(yè)務(wù)的增長率每年達(dá)到了50%以上。
除了業(yè)務(wù)的提前布局,科大訊飛也在加快語音領(lǐng)域的技術(shù)儲(chǔ)備。目前,在語音識別上,訊飛在采用深度神經(jīng)網(wǎng)絡(luò)算法的同時(shí),還加入了視覺識別的方法。利用大腦在處理視覺圖片的方法來處理聽覺內(nèi)容。這樣的方法讓訊飛的識別正確率從原來的93%提高到了96%。在今年的國際多通道語音分離和識別大賽(CHiME)上,科大訊飛包攬了CHiME賽事全部三個(gè)項(xiàng)目的最好成績。三個(gè)項(xiàng)目分別是六麥克風(fēng)、雙麥克風(fēng)和單麥克風(fēng)場景下的語音分離和英文識別任務(wù)。
高考機(jī)器人提前完成既定目標(biāo)
讓“機(jī)器人”也能考上重點(diǎn)大學(xué),這是2年前,訊飛超腦計(jì)劃公布時(shí)的目標(biāo)之一。經(jīng)過兩年的發(fā)展,據(jù)胡郁介紹,目前這款高考機(jī)器人已經(jīng)現(xiàn)進(jìn)行了中間考核,在語文、數(shù)學(xué)、地理和歷史學(xué)科取得了很多進(jìn)展。
“從中期考核結(jié)果來看,高考機(jī)器人的整個(gè)系統(tǒng)現(xiàn)在已經(jīng)跑通。我們對整個(gè)系統(tǒng)進(jìn)行了初步的原理性驗(yàn)證,可以說系統(tǒng)已經(jīng)搭建起來了。現(xiàn)在做的事情是提升他的新能。”胡郁在接受澎湃新聞(www.thepaper.cn)專訪時(shí)說。
那么目前這款高考機(jī)器人究竟已經(jīng)達(dá)到什么樣的程度,胡郁舉了一個(gè)例子。現(xiàn)在機(jī)器人已經(jīng)可以做到如何表征人類的語言、知識和常識。機(jī)器人采用與人類相似的注意力模型,可以讓機(jī)器人在學(xué)習(xí)的時(shí)候,像人類一樣分配自己的注意力,將注意力放在自己需要的知識上。
按照此前制定的目標(biāo),訊飛的高考機(jī)器人希望能在十年內(nèi)考上重點(diǎn)大學(xué)。據(jù)胡郁透露,現(xiàn)在這一目標(biāo)有望縮短到3年時(shí)間。
“因?yàn)闄C(jī)器人的工作數(shù)據(jù)量很大,現(xiàn)在需要進(jìn)行一些人工修正和調(diào)試,看能否達(dá)到當(dāng)時(shí)預(yù)想效果。”胡郁告訴澎湃新聞。
人工智能的這幾年的迅猛發(fā)展,讓人開始期待未來的智能生活。在采訪的最后,澎湃新聞問胡郁,在他看來什么時(shí)候人工智能的時(shí)代真的能進(jìn)入到普通大眾的生活。他回答:“在數(shù)字領(lǐng)域里,我們可以做到很多的快速改進(jìn),但在實(shí)體領(lǐng)域,我覺得機(jī)器人面臨的挑戰(zhàn)更大。我的觀點(diǎn)是,預(yù)測未來的最好辦法是創(chuàng)造它。我希望我們能直接參與到創(chuàng)造人工智能的時(shí)代里。”