中興車聯(lián)網(wǎng)模擬新科技吸引眼球。深圳特區(qū)報記者 邱海彬 攝
互聯(lián)網(wǎng)產(chǎn)業(yè)之后的又一個新興熱點,深不可測的市場潛能,萬億產(chǎn)值爆發(fā)前夜……關(guān)于人工智能,無論科技界還是產(chǎn)業(yè)界,都拿出了最具想像力的詞匯與最美好的期待,盡情繪制那未知的藍圖。作為中國高新技術(shù)產(chǎn)業(yè)重鎮(zhèn),深圳又一次走在了一個新興產(chǎn)業(yè)的發(fā)展最前沿。在剛剛起飛的人工智能產(chǎn)業(yè),深圳究竟處于雁陣的什么位置?產(chǎn)業(yè)布局如何?發(fā)展后勁如何?它是否會成為深圳高科技產(chǎn)業(yè)未來十年的又一新興推動力?本報今日起推出“聚焦深圳人工智能產(chǎn)業(yè)”系列報道,希望通過大量一線采訪,從多個角度、多個側(cè)面為深圳人工智能產(chǎn)業(yè)勾勒一個三維立體圖像。
基礎(chǔ)科研與世界同步
人工智能領(lǐng)域有兩項標志性事件:1996年,超級電腦“深藍”首次挑戰(zhàn)國際象棋冠軍卡斯帕羅夫,以失利而告終;2016年,人工智能程序“阿爾法狗”擊敗圍棋冠軍李世石,并隨之在人類頂尖職業(yè)棋手中所向披靡。
20年間,一負一勝,中間橫亙的是人工智能領(lǐng)域近年來最重要的技術(shù)突破:深度學習。
與以往數(shù)次新技術(shù)浪潮不同的是,這一次,中國科技工作者全程圍觀、同時深度參與其中,在人工智能定制芯片、算法等基礎(chǔ)領(lǐng)域均有開創(chuàng)性貢獻。
更令人驚訝的是,面對人工智能浪潮的興起,科學家們直接出手啦!
湯曉歐,麻省理工學院博士、香港中文大學信息工程系系主任,全球人臉識別技術(shù)的開拓者與探路者。2014年,湯曉歐團隊發(fā)布的研究成果顯示,其原創(chuàng)的人臉識別算法,準確率達到98.52%,首次超越人眼識別能力。2016年,他所率領(lǐng)的人工智能團隊,與麻省理工、斯坦福大學等人工智能領(lǐng)域最前沿的研究團隊一起,入選世界十大人工智能先鋒實驗室,成為亞洲唯一入選的實驗室。同時,他所創(chuàng)立的人工智能企業(yè)商湯科技,也始終位于人工智能產(chǎn)業(yè)的第一集團軍。
在湯曉歐教授的名片上,記者看到一個熟悉的“深圳元素”——他同時兼任著中國科學院深圳先進技術(shù)研究院副院長。這意味著,湯曉歐團隊已經(jīng)在深圳布下了一個積極推進人工智能基礎(chǔ)研究的“尖刀連”。
中科院深圳先進院集成所副所長、多媒體集成技術(shù)研究中心主任喬宇,正是這支“尖刀連”的領(lǐng)隊者。從日本東京大學學成歸國的喬宇,在接受記者采訪時,舉手投足之間仍是學者的謙和與嚴謹。
他告訴記者,在人工智能底層研究的“算法”領(lǐng)域,他們這支“尖刀連”率先提出“軌跡卷積特征TDD”,在一些視頻數(shù)據(jù)集取得領(lǐng)先的識別率,領(lǐng)先國際頂尖的牛津、谷歌、斯坦福、臉譜等課題組當時的結(jié)果;他們開發(fā)的“運動向量卷積神經(jīng)網(wǎng)絡(luò)”將處理速度提升40倍。該團隊在CVPR、ICCV、IJCV等國際頂級視覺會議和期刊上發(fā)表20多篇論文,是全世界在行為識別領(lǐng)域發(fā)表頂級論文最多的團隊之一。
躋身世界最前沿研究團隊之列,保持與國際一流科研團隊交替領(lǐng)先的局面,這是深圳的新高度,也是中國的新高度。
這樣的技術(shù)領(lǐng)先性,不僅存在于專業(yè)的科研機構(gòu),同樣出現(xiàn)在了新興的科技創(chuàng)新性企業(yè)中。
在一家成立僅兩年的高科技企業(yè)——鯤云科技,記者見到了世界首款針對定制芯片的高層編譯軟件HANDEL-C的創(chuàng)始人、英國工程院院士、帝國理工大學教授陸永青。作為率先將定制計算機應(yīng)用到金融、AI領(lǐng)域的華人科學家,陸永青教授與他的學生牛昕宇聯(lián)合創(chuàng)建了鯤云科技,并將之落地深圳。
這意味著深圳擁有了一家人工智能芯片和解決方案提供商,其核心科研團隊落胎自世界人工智能最前沿團隊之一的帝國理工大學,將致力于打造數(shù)據(jù)流芯片定制人工智能處理器和端到端自動編譯開發(fā)平臺。
應(yīng)用需求催生源頭技術(shù)創(chuàng)新
在記者采訪的過程中,不少人表達了這樣的驚訝:人工智能技術(shù)為什么能一夜之間在深圳遍地開花,短短數(shù)年間便形成了百舸爭流的繁榮景象?
記者也很快從采訪對象口中獲得了一個共同的答案:豐富的應(yīng)用場景是深圳吸引廣大人工智能產(chǎn)業(yè)創(chuàng)業(yè)者的重要原因,來自應(yīng)用端的需求,同樣積極推動著人工智能底層基礎(chǔ)技術(shù)的快速研發(fā)。
在生物醫(yī)學成像領(lǐng)域,記者從互為戰(zhàn)略合作伙伴的兩家機構(gòu)身上,看到了基礎(chǔ)研究與落地應(yīng)用相互促進、相互依存的生動例證。
中國科學院深圳先進技術(shù)研究院醫(yī)工所醫(yī)學人工智能研究中心主任兼勞特伯生物醫(yī)學成像研究中心副主任梁棟,用盡量通俗的語言向記者解釋他們正在進行的研究:一是提高磁共振成像的速度,通過減少偽影從而提高圖像的質(zhì)量,促進磁共振的廣泛臨床應(yīng)用;二是將人工智能技術(shù)引入醫(yī)學影像鏈條的前端,實現(xiàn)智能化掃描和成像,從而提供高質(zhì)量的圖像幫助醫(yī)生進行分析和識別。后者便是當前人工智能技術(shù)在醫(yī)學影像領(lǐng)域的一個重要應(yīng)用。
該研究中心不僅在關(guān)鍵技術(shù)上已經(jīng)申請了相關(guān)專利,而且正與國內(nèi)影像設(shè)備生產(chǎn)廠商進行著密切的開發(fā)合作,希望能盡快將這項技術(shù)應(yīng)用到醫(yī)學成像實踐中。
“作為中國最先進的影像設(shè)備生產(chǎn)商,上海聯(lián)影是在先進院最初參與孵化的高科技企業(yè),與我們研究中心已經(jīng)開展了長期深入的合作。在基于人工智能的醫(yī)學成像領(lǐng)域,我們已與世界同類科研機構(gòu)處在并駕齊驅(qū)的位置上。世界一流的人工智能技術(shù)必將幫助上海聯(lián)影從GE、西門子、飛利浦這些老牌跨國巨頭長期壟斷的專業(yè)市場中分一杯羹。”在梁棟的語氣里,趕超世界先進技術(shù)的迫切之情已不加掩飾。
在高科技企業(yè)云集的南山區(qū),記者見到了一家積極面向產(chǎn)業(yè)應(yīng)用、同時又擁有相關(guān)領(lǐng)域完整核心技術(shù)的研發(fā)機構(gòu):深港產(chǎn)學研基地旗下的深圳語音搜索及應(yīng)用工程實驗室。
實驗室主任王昕告訴記者,該實驗室在語音識別與搜索領(lǐng)域擁有完整核心技術(shù),采用深度學習算法,充分利用大數(shù)據(jù)資源,承擔了一批國家省市重大和重點項目,研發(fā)水平在華南地區(qū)首屈一指,進入全國第一方陣。其語音識別準確率達到94-95%,語音搜索實時高效,處于國內(nèi)領(lǐng)先水平。
先進的基礎(chǔ)研究能力,使實驗室在深圳豐富的應(yīng)用場景中如魚得水。王昕介紹說:“我們與智能硬件和移動互聯(lián)網(wǎng)產(chǎn)業(yè)開展了深度研發(fā)合作,形成了完整的核心技術(shù)產(chǎn)業(yè)轉(zhuǎn)移應(yīng)用。例如在智能會議系統(tǒng)方面,該項技術(shù)是云和端、軟件與硬件、產(chǎn)品與服務(wù)、語音與圖像文本等領(lǐng)域深度結(jié)合,對技術(shù)和產(chǎn)品及服務(wù)應(yīng)用有很高的要求。我們在該領(lǐng)域與政府、機構(gòu)和企業(yè)保持長期深度合作?!?/p>
在人工智能的另一個重要領(lǐng)域——計算機視覺方面,北京大學信息工程學院、孔雀團隊“圖像與視頻處理技術(shù)”核心成員、市智能多媒體與虛擬現(xiàn)實重點實驗室主任王文敏教授團隊,在視頻生成領(lǐng)域的研究已取得重要進展。
計算機圖像處理分為圖像識別、圖像理解和圖像生成三個階段;視頻也分為三個階段,即視頻分析、視頻理解和視頻生成。如何讓計算機去理解圖像,甚至根據(jù)文字描述生成一張新的圖像;如何通過一幅或若干幅圖像,預測生成一段新的視頻……這些都是他們正在研究的人工智能黑科技。
王文敏告訴記者,視頻生成技術(shù)的應(yīng)用場景非常廣泛,比如無人駕駛技術(shù)就可以通過視頻生成進行突發(fā)事件的預測,從而及時避險。