科大訊飛為什么是“最聰明的公司”
2017-07-27 來源:王珊 中國新聞周刊雜志 評論:0
中國電子信息博覽會上,小朋友體驗科大訊飛VR創(chuàng)新教學產(chǎn)品。圖 | 受訪者提供
以報道新興科技與創(chuàng)新商業(yè)為特色的《麻省理工科技評論》,在進入互聯(lián)網(wǎng)時代以后很受中國年輕一代技術(shù)男們的追捧,而這本雜志實際上已有118年的歷史了。
2017年6月27日,《麻省理工科技評論》發(fā)布了“全世界最聰明的50家公司”榜單,其中排名全球第六、中國第一的,不是風頭正勁的中國互聯(lián)網(wǎng)巨頭BAT中的任何一家,而是科大訊飛。
該刊對科大訊飛的上榜理由是這樣描述的:“該公司旗下的語音助理技術(shù)是中國版的Siri。其可攜帶實時翻譯器則是一款杰出的人工智能應用,克服了方言、俚語和背景雜音,可將漢語精準地翻譯成十幾種語言。”
科大訊飛董事長劉慶峰對“人工智能+”時代的趨勢總結(jié)道,“以語音為主導,以鍵盤和觸摸屏為輔助的人機交互時代正在到來。”在他描繪的圖景里,未來的人工智能會像水和電一樣進入每個行業(yè),深刻地改變?nèi)祟惖氖澜?。這其中,“語音是人工智能的重要入口”。他認為,這是訊飛走紅的原因。
“我們很榮幸入選‘最聰明的公司’,但是我覺得,科大訊飛在過去十幾年做的幾乎每件事都是挺笨的。”在《麻省理工科技評論》揭曉“全世界最聰明50家公司”現(xiàn)場致辭時,科大訊飛高級副總裁江濤說。
對于當下的中國青年人來說,創(chuàng)業(yè)是一種時髦,然而對于訊飛來說,卻開始于近20年前。
1999年,科大訊飛成立,18名成員全部是中國科學技術(shù)大學的畢業(yè)生。此時,恰逢全球語音技術(shù)產(chǎn)品化的第一波熱潮。微軟、IBM、英特爾和摩托羅拉都在中國成立了專門的語音研究基地,并把中文作為最重要的戰(zhàn)略主攻方向之一。
然而,這一波熱潮并沒有真正熱起來。其原因,是受語音技術(shù)發(fā)展水平的限制。劉慶峰記得,當時語音合成出來的效果是“一字一頓”的,連續(xù)性不好;而語音識別和語音解析則更多地停留在實驗室階段。
語音技術(shù)如何賺錢,初創(chuàng)團隊誰都說不清楚。當時,蘋果的Siri還沒出現(xiàn),距人機語音交互也還十分遙遠,但那時劉慶峰就認為,語音技術(shù)遲早要面對大眾,融入人們的日常生活。如果說,語音合成是讓機器擁有人類的聲音,那么,語音識別和語音解析則是賦予了機器人的耳朵和大腦。讓機器能聽會說,成為訊飛成立之初就設(shè)定的目標。
按照當時的估算,這項技術(shù)有著100億元左右的市場空間,但這只是幾個創(chuàng)業(yè)青年的簡單推算。劉慶峰回憶說,“我們當時想,語音用在工商查詢系統(tǒng)中會有多大市場規(guī)模?我們的系統(tǒng)使用費用20萬元,全國400個工商局就是8000萬元,如果放到教育上豈不是更大?”
不久,他們開發(fā)了一款名叫“暢言2000”的電腦軟件。這是一款能把語音自動轉(zhuǎn)換成文字的工具,甚至還可以讓用戶通過語音控制電腦,現(xiàn)在看來,這有點像訊飛后來一些產(chǎn)品的原型了。
一開始,這款設(shè)計受到了很多人的喜愛,尤其是對電腦接受度低的離退休人群。但是很快劉慶峰就發(fā)現(xiàn)產(chǎn)品很難賺到錢。一方面是因為盜版橫行,另一方面,用戶年齡偏大,對電腦知之甚少,維護成本高。
他們試圖將技術(shù)提供給中國電信等大公司來獲取利潤,對方卻不放心將單子交給一個十幾人組成的年輕團隊。后來,劉慶峰想辦法將技術(shù)嵌在包括華為在內(nèi)的大的技術(shù)平臺上,謀求與第三方的合作。這成為后來訊飛主要的商業(yè)模式。
劉慶峰許下的上億元規(guī)模的市場空間并沒有成為現(xiàn)實,而且大筆的收入被投入到核心技術(shù)的進一步研發(fā)中了,創(chuàng)業(yè)成員只能拿到兩三千元的工資?,F(xiàn)實讓他們感到有些失望。同時,各種質(zhì)疑聲四起。劉慶峰則堅持,“我們不可能一步登天,只能腳踏實地。成功一定會來,但絕對不是現(xiàn)在。”
直到2010年,公司推出了訊飛輸入法,以此宣告語音聽寫時代的到來。劉慶峰還記得發(fā)布會的地點是在北京的香格里拉飯店,當時整個會場的人都很興奮。一位在場的記者用福州口音嘗試了訊飛輸入法后激動地說,“中國終于有個像Siri的產(chǎn)品出現(xiàn)了”。
然而,訊飛輸入法并沒有預料中的那樣突飛猛進。劉慶峰很清楚,“當時80%的識別率是在特定場景下實現(xiàn)的,然而,如果在噪聲環(huán)境或網(wǎng)絡(luò)環(huán)境不好的情況下,實際的識別率就只有60%了。”
當時,訊飛剛剛將“深度學習”技術(shù)引入到語音識別中去,“機器學習”依然是最主要的計算方法。這個已經(jīng)發(fā)展數(shù)十年的技術(shù)對于語音的特征提取有著天然的局限性。其他條件也都還沒有準備好。2010年,距離中國政府正式發(fā)布3G牌照僅僅一年的時間,國內(nèi)手機市場依然是以2G為主導。移動網(wǎng)絡(luò)的限制體現(xiàn)在數(shù)據(jù)傳送速度上,用戶說完話后,需要等待一段時間才能將語音變成文字。
五年之后,一切都發(fā)生了變化。2015年,全球智能手機出貨量為12.93億部,年增長10.3%。2016年,這一數(shù)據(jù)為14.8億臺。截至2016年7月,中國移動電話4G用戶總數(shù)達到6.46億。
與此同時,深度學習技術(shù)也迅速發(fā)展起來。深度學習通過建立、模擬人腦進行分析學習的神經(jīng)網(wǎng)絡(luò),使得機器能從大量歷史數(shù)據(jù)中學習規(guī)律,從而對新的樣本做智能識別或?qū)ξ磥碜鲱A測,以達到具有人類一樣的思考能力。這一技術(shù)迅速地被應用在語音識別、圖像識別等領(lǐng)域。
語音技術(shù)一下子火了起來。智能語音在國外得到互聯(lián)網(wǎng)巨頭的重視。蘋果推出了Siri,谷歌發(fā)布了GoogleNow,微軟的Cortana也問世了。這些公司都希望通過語音助手來打開人工智能的入口。2016年9月,微軟執(zhí)行副總裁沈向洋在接受媒體采訪時表示,語音的徹底主流化已經(jīng)不是一個需要討論的問題,只是一個時間和習慣轉(zhuǎn)移的問題。
“互聯(lián)網(wǎng)女皇”瑪麗·米克爾(Mary Meeker)發(fā)布2016年互聯(lián)網(wǎng)趨勢報告,用近四分之一的篇幅論述語音識別交互帶來的改變,將語音功能贊譽為“人機交互的新范式”。她說,語音功能解放了雙手和眼睛,擴展了永遠在線的概念,只需要一個聲音的交流,就可以迅速高效地完成一些操作,傳統(tǒng)的鍵盤、手寫板或現(xiàn)在流行的視頻都不可能如此充滿想象力而且便利。
劉慶峰終于等到了最好的時代。訊飛語音占領(lǐng)了各類會議的大屏幕,訊飛輸入法成為互聯(lián)網(wǎng)人的標配。“許多人覺得人工智能突然火了,但我們其實一直在這個領(lǐng)域努力。科大訊飛看準一個方向,就會不遺余力地走下去。”
一切都朝著新的目標努力,即機器不僅能聽會說,還能理解、會思考。在資金投入上,科大訊飛每年將銷售收入的25%投入研發(fā)中去,遠超其他科技企業(yè)3%~5%的平均水平。不過,做出一款類似《超能陸戰(zhàn)隊》里的大白的產(chǎn)品,能夠完全理解人類的語言和行為,注定是一場漫長的戰(zhàn)役。
比如說,既有的語音識別工具仍然不能勝任嘈雜或回聲繚繞的地方——訊飛的產(chǎn)品目前也只能保證5米內(nèi)的識別;如果硬件比較差,那就更糟糕了,對語音識別的結(jié)果會變得磕磕絆絆。“要把一個人工智能的‘耳朵’做成一般人的聽力水平并不難,問題是要讓這只耳朵在嘈雜環(huán)境下也能聽懂人說話,那就不是容易的事情。”劉慶峰說。
按照他的說法,人工智能可以分成三大階段,第一個階段叫計算智能,如計算機下象棋贏了國際象棋大師,代表了計算能力越來越強;第二個是感知智能,機器在視覺、聽覺上以及語音上超越人類;而下一步就是認知智能,讓機器有學習和推理能力。只有這樣,人工智能才能帶來更多驚喜。
科大訊飛信息科技股份有限公司的訊飛研究院內(nèi),研發(fā)人員在實驗室監(jiān)測車內(nèi)噪聲環(huán)境下車載語音導航的識別率。圖|新華
“最聰明的”訊飛到底有多聰明?在訊飛的“曉譯翻譯機”發(fā)布會現(xiàn)場,科大訊飛高級副總裁胡郁演示了該產(chǎn)品的功能。他邀請一位外國女士上臺。這位女士懂一點漢語,卻不能完成流利的交談。雙方都手持著一個翻譯機。胡郁說中文,對方則用英語。
“你好,歡迎參加我們的發(fā)布會,請問你叫什么名字?”
“我叫南希,我很榮幸能參加這場盛會。”
“看了這么多產(chǎn)品,你覺得怎么樣?”
“很精彩,我覺得好玩又有趣。”
“有了這個設(shè)備后,你覺得還有必要學中文嗎?”
“這個設(shè)備讓我震撼。我想推薦給我的朋友們,但是學習中文還是我最大的興趣。”
“翻譯機擁有大學英語六級的水平,能起到日常交流的作用,但還不能取代同傳。”科大訊飛多語種翻譯業(yè)務(wù)線副總監(jiān)馬家領(lǐng)告訴《中國新聞周刊》。
語音翻譯是集語音識別、口語翻譯和語音合成為一體的技術(shù)。隨著全世界互聯(lián)互通不可阻擋的趨勢,它被視為當前移動互聯(lián)時代最受矚目的影響人類生活的重大技術(shù)之一。
機器翻譯的歷史最早可以追溯到1954年。當時,美國喬治敦大學與IBM公司聯(lián)合使用IBM-701計算機首次完成了英俄機器翻譯試驗,拉開了機器翻譯研究的序幕。此后幾十年間眾多不同的翻譯方法相繼出現(xiàn)。
自20世紀80年代末以來,語音翻譯技術(shù)一直備受各國政府和研究機構(gòu)的關(guān)注和重視。1985年,美國航空航天局翻譯科主任 Timothy J.Rowe 就說過:“機器翻譯是明天就要掀起的浪潮,這一點已毫無疑問了。”然而,這一技術(shù)的發(fā)展并沒有預料的那么迅速。語音翻譯僅僅涉及天氣信息、觀光旅游、購物和旅館預訂等限定領(lǐng)域的實驗研究,主要以研究、系統(tǒng)演示和展示為主。
人們頗為熟知的在線翻譯讓機器翻譯技術(shù)往前邁進了一步。它的工作原理是將整個句子切分多個詞組、短語,進行翻譯組合。比如,在中英文翻譯中,它會把中文、英文短語之間的影射關(guān)系建立起來,解決的是對齊問題,譯成小短語,以達到最大化的翻譯流利程度。不過,這種組合產(chǎn)生的翻譯方式因為較大的誤差而不實用。
訊飛采用的技術(shù)將機器翻譯大大地往前推進了一步。它使用的是“編碼器-解碼器”模型,能夠?qū)卧~的特征進行提取,并具備語譯能力,這是基于人工神經(jīng)網(wǎng)絡(luò)的一種機器學習方法,能夠模擬人腦神經(jīng)的層級結(jié)構(gòu),從基礎(chǔ)層開始,每一層都對從上一層接收來的信息進行抽象,自動識別出語言的規(guī)則、模式。這也是目前業(yè)界都在努力研究的一個方向。
在美國,谷歌、微軟都將神經(jīng)網(wǎng)絡(luò)應用于機器翻譯領(lǐng)域,谷歌更是表示會將神經(jīng)網(wǎng)絡(luò)機器翻譯技術(shù)推廣到Google Translate支持的全部103個語種中。
美國國家標準技術(shù)研究院(NIST)組織的機器翻譯大賽(Open Machine Translation Evaluation)被業(yè)界視為全球最權(quán)威的機器翻譯技術(shù)評測。2015年,在眾多巨頭的包圍下,科大訊飛取得了全球第一的成績,能夠做到字到字的完全準確,包括語義理解準確。而一年前,科大訊飛在2014年國際口語翻譯大賽(IWSLT)上獲得中英和英中兩個翻譯方向的全球第一名。
現(xiàn)在,只要依靠手中比智能手機還要小的翻譯機,就可以出國旅游,甚至進行一些低難度的商務(wù)會談。人人都渴望的實時翻譯技術(shù)似乎已經(jīng)變成現(xiàn)實,更有人提出,機器翻譯或?qū)⑷〈晜髯g。
不過,劉慶峰試圖給樂觀的人潑點冷水,“機器翻譯大賽,訊飛雖然獲得了第一名,但準確率只有52%,跟人工翻譯還有很大差距。”劉慶峰告訴《中國新聞周刊》。
確實,在人工智能的武裝下,機器翻譯的準確度有了很大的提高,在一定程度上可以達到“信”的標準,但若想實現(xiàn) “達”和“雅”的要求,則有些力不從心。尤其是對于那些有多種修辭手法的詩歌、小說來說,要想實現(xiàn)較為精確的翻譯,難度就更大了。
科大訊飛高級副總裁杜蘭描繪了未來使用語音實現(xiàn)各種人機交互的典型的一天:早上來到客廳,對智能電視說一句“回看昨晚的新聞聯(lián)播”,電視便按你的心意播放;隨后,你可以通過喚醒語音操控系統(tǒng),將家里的空氣凈化器、空調(diào)、加濕器等電器調(diào)整到最舒適健康的狀態(tài)。
上午,要開一個重要會議,合作伙伴來自韓國、日本和美國等國家,翻譯機可以實時將多國語言轉(zhuǎn)化成文字并翻譯在大屏幕上,來自各國的參會者不用翻譯就能進行溝通。
下班后,你駕駛著汽車問語音助手,怎么去最近的某銀行營業(yè)大廳,它將把快速搜索的結(jié)果推薦給你,并規(guī)劃好前往的路線。
……
一切都顯得太智能、太美好了,在未來,動動嘴就能過上智能生活。更讓人興奮的是,當智能手機、平板電腦、智能手表、智能電視以及更多日常物品接入互聯(lián)網(wǎng),這一切就已經(jīng)不遠了。
拓普研究所的數(shù)據(jù)顯示,2014年到2017年全球語音設(shè)備出貨量大幅度攀升。2014年全球出貨量不足500萬臺,到2017年出貨量將達到2500萬臺。預計到2020年,全球語音識別的市場規(guī)模將會從2015年的61.9億美元增長到200億美元。
美國研究機構(gòu)BI Intelligence發(fā)布的《2016年全球物聯(lián)網(wǎng)發(fā)展研究報告》則預測,2020年全球?qū)⒂?40億臺設(shè)備接入互聯(lián)網(wǎng),平均每人有4個硬件設(shè)備。其中,語音使得智能家居成為物聯(lián)網(wǎng)時代最激烈的戰(zhàn)場。據(jù)研究機構(gòu)Research and Markets報告顯示,未來五年,全球智能家居設(shè)備和服務(wù)市場將每年以8%~10%的速度增長,到2018年市場規(guī)模將達到680億美元。
那么,用什么當作智能家居的入口呢?最先入局的是亞馬遜。2014年,亞馬遜推出智能音箱echo,它能夠接收來自房間各個角落的聲音,可在不到兩秒內(nèi)回應諸如交通狀況等日?,嵤碌脑儐?。亞馬遜選擇音箱的原因很簡單,首先必須是家居設(shè)備,價格不能太貴,最好每個人都買得起;其次是共有需求。
谷歌緊隨其后。2016年5月,谷歌發(fā)布了智能音箱Google Home。競爭到了2017年愈加白熱化。當年5月,在48小時內(nèi),來自三家公司的音箱產(chǎn)品競相發(fā)布:微軟攜手三星旗下音響品牌哈曼卡頓,發(fā)布智能音箱Invoke;聯(lián)想集團發(fā)布中國版本智能音箱;亞馬遜在美國發(fā)布帶7英寸觸摸屏的Echo Show。6月28日剛剛發(fā)布的這款新品是音箱與平板電腦的結(jié)合。很明顯,這些大牌公司的目標跟亞馬遜一樣,即通過音箱打造一個無所不在的電商模式。
2015年,科大訊飛攜手京東發(fā)布了類似的產(chǎn)品叮咚音箱。劉慶峰覺得,音箱本身炫酷,又有時尚感,可以作為智能家居的一個入口。不過,在中國,他最看好的依然是電視屏幕。“電視有著成熟的商業(yè)模式和明確的應用價值,家家戶戶都有一塊電視屏,現(xiàn)在只需要把他們激活就行了。在電視上花力氣,是會有回報的。”
訊飛正在執(zhí)行的“訊飛超腦”計劃正在努力將一切變?yōu)楝F(xiàn)實,未來,你可以通過用語音指揮電視進行購物,也可以由此來控制家里的冰箱、洗衣機、熱水器;甚至將教育資源搬上電視。
最近一年多以來,在資本的加持下,許多公司紛紛貼上了人工智能的標簽。李開復曾在演講中提到,他見到過一個內(nèi)衣企業(yè),也聲稱自己是人工智能企業(yè)。“這是非常不正常的現(xiàn)象。現(xiàn)在,人工智能領(lǐng)域的泡沫化特別嚴重。”“新經(jīng)濟100人”創(chuàng)始人兼CEO李志剛則表示“未來兩三年,95%以上的人工智能創(chuàng)業(yè)公司要倒閉”。
為此,劉慶峰提議建設(shè)中國的人工智能聯(lián)盟。對于開發(fā)者來說,一個統(tǒng)一的標準,能夠避免產(chǎn)品開發(fā)中的資源浪費,對于消費者來說也劃算;其次,有了標準之后,可以避免魚龍混雜。“人工智能不能只停留在概念,大家都說自己的產(chǎn)品好,但是缺乏評定標準,老百姓和政府也搞不清楚,人工智能是浪潮還是泡沫,也很難說明白。有了標準,一切都可以解決。”
產(chǎn)業(yè)聯(lián)盟的成立也有利于中國企業(yè)聯(lián)合起來應對國外的競爭。 《紐約時報》曾發(fā)文指出,美國正面臨挑戰(zhàn),其在機器人和人工智能領(lǐng)域一家獨大的想法已然過時,中國的公司正在一點點瓜分市場。“人工智能真的要贏,絕對不是一個企業(yè)取代另一個企業(yè),是一個產(chǎn)業(yè)鏈和一個產(chǎn)業(yè)鏈的競爭,是一個生態(tài)對一個生態(tài)的競爭。”劉慶峰說,目前國際范圍內(nèi)人工智能的對抗依然主要是中美兩國之間的對抗,想要贏得戰(zhàn)爭,必須要協(xié)同起來
相關(guān)熱詞搜索:科大訊飛 先進制造業(yè) 智能制造
- ·科大訊飛:對手是谷歌微軟 BAT不入眼2017-07-17
- ·中國機器人日益崛起 機器人市場競爭新格局2016-03-21
- ·未來智能物流——機器人和智能系統(tǒng)或成好拍檔2016-03-23
- ·中國工業(yè)機器人空間有多大?2016-03-25
- ·2018年中國機器人安裝量將超世界總量三分之一2016-03-28
評論排行
- ·李克強:中國要追趕工業(yè)4...(6)
- ·朱森第:融合發(fā)展——邁...(5)
- ·AM先進制造業(yè)·高端沙龍(4)
- ·石墨烯,推動下一代節(jié)能...(3)
- ·工經(jīng)聯(lián)會長李毅中:“互...(3)
- ·工業(yè)機器人將突破智能模塊(2)
- ·群雄逐鹿,誰主“云計算...(2)
- ·AM·高端沙龍第一期:企...(2)
- ·“懶夫人”聚醚醚酮,醫(yī)...(1)
- · 訪清華大學教授、中國...(1)
- ·北斗產(chǎn)業(yè)步入良性發(fā)展軌...(1)
- ·聚焦“互聯(lián)網(wǎng)+制造業(yè)”高...(1)
- ·智慧光伏云:云計算+大數(shù)...(1)
- ·5G助跑“互聯(lián)網(wǎng)+”? ...(1)
- ·機器人將進軍國際航空制...(1)
- ·防患于未然:企業(yè)安全最...(1)
- ·互聯(lián)網(wǎng)+房地產(chǎn),賣房、上...(1)
- ·9大互聯(lián)網(wǎng)企業(yè)聯(lián)姻新能源...(1)
- ·海工裝備的“深?!背雎?/a>(1)
- ·朱森第:“智”造強國的...(1)