中國AI四小龍通過科創(chuàng)板審核 有望成為AI第一股

來源:第一財經(jīng)

日,以CV(計算機視覺)起家、隨后晉身“中國AI四小龍”的云從科技IPO申請已通過科創(chuàng)板審核,若后續(xù)進展順利,云從有望成為“AI第一股”。

實際上,同在四小龍隊列的其他三家公司,在證券市場的表現(xiàn)一直不盡如意。曠視科技2019年曾經(jīng)沖擊港股上市,2020年赴港上市計劃擱淺,后來又在2021年3月沖擊科創(chuàng)板上市,目前仍在排隊狀態(tài)。而依圖科技也曾經(jīng)沖擊科創(chuàng)板,后于2021年6月撤銷上市申請。

作為四小龍領(lǐng)軍者的商湯科技,雖然有關(guān)融資的聲音傳出不斷,但依舊沒有落實上市的具體細節(jié)。

當(dāng)下真的是AI四小龍上市的最佳時機嗎?

7月16日,國家網(wǎng)信辦會同公安部、國家安全部、自然資源部、交通運輸部、稅務(wù)總局、市場監(jiān)管總局等部門聯(lián)合進駐滴滴出行科技有限公司,開展網(wǎng)絡(luò)安全審查。

一時間,凡是涉及大數(shù)據(jù)的互聯(lián)網(wǎng)行業(yè)企業(yè),都有風(fēng)雨欲來的感覺。

業(yè)內(nèi)人士認為,以深度學(xué)習(xí)作為核心AI理論的AI四小龍,其實已經(jīng)感受到了非常大的壓力。

甚至有言論表示, AI四小龍現(xiàn)在要過數(shù)據(jù)安全關(guān)了。

#01

繞不開的核心

現(xiàn)在說AI四小龍必須重視數(shù)據(jù)安全,跟他們所采取的AI核心理論有關(guān)。

經(jīng)過多年發(fā)展,AI技術(shù)已經(jīng)從2006年多倫多大學(xué)的杰弗里·辛頓教授對外發(fā)布自己的那三篇關(guān)于深度學(xué)習(xí)的論文開始,逐漸衍生出眾多的流派。

現(xiàn)在主流的是三大技術(shù)領(lǐng)域,也就是深度學(xué)習(xí)、機器邏輯和人工大腦。

所謂機器邏輯是希望通過算法和數(shù)據(jù)的疊加,讓計算機具備符合人類社會要求的邏輯和方法論,可以自主在某個領(lǐng)域判斷并分析相應(yīng)問題,并得出答案。

所謂人工大腦,實際上是通過對人類大腦組織的研究,利用計算機的能模擬和算法組織,形成類人工大腦功能和工作機制的計算機集群。

以上兩種人工智能理論,要么是從行為上希望能模擬人類的運作,要么是從大腦結(jié)構(gòu)上希望對人類解析從而產(chǎn)生技術(shù)上的突破。問題是,這兩個領(lǐng)域現(xiàn)在都是在探索階段,離相應(yīng)產(chǎn)品落地還有很長的距離。

當(dāng)下AI技術(shù)落地最普遍的,還是深度學(xué)習(xí)。

深度學(xué)習(xí)技術(shù)意味著計算機要進入學(xué)習(xí)樣本數(shù)據(jù)的內(nèi)在規(guī)律和表示層次,這些學(xué)習(xí)過程中獲得的信息對諸如文字、圖像和聲音等數(shù)據(jù)的解釋有很大的幫助。

它的最終目標(biāo)是讓機器能夠像人一樣具有分析學(xué)習(xí)能力,能夠識別文字、圖像和聲音等數(shù)據(jù)。深度學(xué)習(xí)是一個復(fù)雜的機器學(xué)習(xí)算法,在語音和圖像識別方面取得的效果,遠遠超過先前相關(guān)技術(shù)。

在深度學(xué)習(xí)之前,哪怕是百度這樣的AI巨頭,都無一例外經(jīng)歷了窮舉法的所謂“特征工程”階段。例如最早的阿波羅自動駕駛臺,所有在AI中計算機應(yīng)該對路上發(fā)生行為進行的反應(yīng),都是由線下的工作人員根據(jù)人工對此的反應(yīng)進行的標(biāo)注。

一方面,每個人對任何事項的判斷和反應(yīng)都有著不同,這些不同積累到一定程度就容易引發(fā)AI系統(tǒng)的結(jié)構(gòu)化錯誤;另一方面,要想完成龐大的面向社會層面操作的AI系統(tǒng),那這種數(shù)據(jù)標(biāo)注的結(jié)構(gòu)下,又要動用大量的人力和時間。

這種數(shù)據(jù)標(biāo)注的“特征工程”方式實際上是一種“偽”AI,人類訓(xùn)練計算機只是進行一種簡單的因果關(guān)系,而并沒有掌握事情的本質(zhì)。

年來,研究人員逐漸將“特征學(xué)習(xí)”和“規(guī)律發(fā)現(xiàn)”等AI方法結(jié)合起來,對原本已有督學(xué)習(xí)為基礎(chǔ)的卷積神經(jīng)網(wǎng)絡(luò),結(jié)合自編碼神經(jīng)網(wǎng)絡(luò)進行無監(jiān)督的預(yù)訓(xùn)練,進而利用鑒別信息微調(diào)網(wǎng)絡(luò)參數(shù)形成的卷積深度置信網(wǎng)絡(luò)。

與傳統(tǒng)的學(xué)習(xí)方法相比,深度學(xué)習(xí)方法預(yù)設(shè)了更多的模型參數(shù),因此模型訓(xùn)練難度更大,根據(jù)統(tǒng)計學(xué)習(xí)的一般規(guī)律來看,模型參數(shù)越多,需要參與訓(xùn)練的數(shù)據(jù)量也越大。

而隨著計算機技術(shù)的進步以及分布化網(wǎng)絡(luò)的形成,越來越多的算力,可以通過網(wǎng)絡(luò)協(xié)調(diào)提供,這也就給人類AI技術(shù)的發(fā)展提供了一個新的基礎(chǔ)。

可以說,深度學(xué)習(xí)逐漸成為AI的主流。另外,由于大量數(shù)據(jù)的引用和積累,深度學(xué)習(xí)跟數(shù)據(jù)安全之間,也產(chǎn)生了必要的聯(lián)系。

#02

深度學(xué)習(xí)的痛點

實際上,在數(shù)據(jù)安全方面,深度學(xué)習(xí)有著自己基本無法解決的痛點。

由于深度學(xué)習(xí)是建立在大量數(shù)據(jù)的應(yīng)用與計算機訓(xùn)練基礎(chǔ)上實現(xiàn),基礎(chǔ)數(shù)據(jù)的獲得,對于深度學(xué)習(xí)技術(shù)的落地非常重要。

比如特斯拉被人詬病的攝像頭自動駕駛技術(shù)。馬斯克一直不愿意采用激光雷達作為關(guān)鍵地標(biāo)數(shù)據(jù)的測定工具,堅持使用攝像頭來采集道路信息,基于龐大的已有汽車上路數(shù)據(jù)的訓(xùn)練,特斯拉本身汽車的自動駕駛技術(shù)穩(wěn)定相對來說很強。

AI四小龍也是如此,這兩年的發(fā)展都跟大量基礎(chǔ)數(shù)據(jù)的積累有關(guān)。

媒體報道顯示,依圖在“AI+醫(yī)療影像分析”方面所有突破,背后是海量的醫(yī)療影像圖片的分析;云從在金融領(lǐng)域的AI學(xué)習(xí)和數(shù)據(jù)分析方面領(lǐng)先,不完全統(tǒng)計其服務(wù)的金融公司就超過50家,日常AI系統(tǒng)處理的數(shù)據(jù)也是一個無法想象的數(shù)量;而曠視科技圍繞AI核心的行業(yè)物聯(lián)解決方案是優(yōu)勢,成百上千萬的物聯(lián)網(wǎng)數(shù)據(jù)交換過程是曠視科技最核心的技術(shù)基礎(chǔ);另外,商湯在監(jiān)控分析和城市管理等方面與政府和企業(yè)達成了不少合作,這也需要大量數(shù)據(jù)進行底層支持。

另外這4家也陸陸續(xù)續(xù)發(fā)布了一些新的技術(shù)服務(wù),而這些新的技術(shù)無一例外都跟大數(shù)據(jù)的獲取和分析一脈相承。

比如商湯科技在上海車展期間發(fā)布了自己的座艙AI數(shù)據(jù)化解決方案,功能直逼華為數(shù)字座艙,與特斯拉的一系列操控系統(tǒng)和自動駕駛功能類似,當(dāng)然這也需要海量數(shù)據(jù)(603138,股吧)對系統(tǒng)進行馴化,才能產(chǎn)生更加準(zhǔn)確的結(jié)果。

如今國家對數(shù)據(jù)安全的重視程度越來越高,這也就意味著以前利用客戶數(shù)據(jù)大量積累,調(diào)試系統(tǒng)的時代一去不復(fù)返。

畢竟根據(jù)剛剛公布的征求意見稿,相應(yīng)用戶在應(yīng)用中的數(shù)據(jù)企業(yè)如果想要采用,必須事先得到用戶本身的許可。

這從一個角度無形中提升了深度學(xué)習(xí)的難度,并讓四小龍現(xiàn)有技術(shù)的進一步拓展和新技術(shù)的落地產(chǎn)生了一些問題。

#03

私有云的無奈

所有的AI企業(yè)在遇到數(shù)據(jù)安全的時候,都會有一系列的預(yù)案。其中只為客戶提供技術(shù),而數(shù)據(jù)訓(xùn)練和學(xué)習(xí)的過程留在客戶自身系統(tǒng)中完成,已經(jīng)成為不少國內(nèi)外AI巨頭,在遭到數(shù)據(jù)安全阻擊的時候采用的重要產(chǎn)品策略。

根據(jù)市場一般的操作方式, AI企業(yè)只負責(zé)制作算法和系統(tǒng)封裝之后的系統(tǒng)提供給用戶,并幫助用戶建立自己的私有云和數(shù)據(jù)空間,然后由用戶根據(jù)相應(yīng)的格式上傳歷史數(shù)據(jù),讓系統(tǒng)自我進行深度學(xué)習(xí),最終完成用戶在 AI領(lǐng)域功能的定制。

這種私有云的部署方式,看似完美解決了AI企業(yè)技術(shù)研發(fā)和用戶數(shù)據(jù)安全之間的矛盾,然而,這樣的情況背后還存在著一個無法解決的問題。

實際上所有這4家企業(yè)做的技術(shù)都是基于深度學(xué)習(xí)而深入學(xué)習(xí),即使出來一個可以安排客戶私有部署的AI系統(tǒng)或者臺,它一定會對某一個行業(yè)的數(shù)據(jù)進行過總結(jié),也一定會有基礎(chǔ)數(shù)據(jù)進行訓(xùn)練才行。

而當(dāng)下的AI技術(shù)并沒有進化到系統(tǒng)可以自主學(xué)習(xí),并樹立獨立人格和思維方式的時代,所有的系統(tǒng)都必須有一個知識邊界,這個知識邊界是越畫越小才能越來越精確。

在這種情況下,AI四小龍推出的任何一款A(yù)I產(chǎn)品,事先都會經(jīng)過哪怕是針對泛行業(yè)的數(shù)據(jù)調(diào)教和深度學(xué)習(xí),形成一定的認知基礎(chǔ),才能作為針對特定行業(yè)的產(chǎn)品交付企業(yè)使用。

否則,AI公司只能是依據(jù)經(jīng)驗和猜測開發(fā)一套系統(tǒng)交給客戶使用,還必須利用客戶的數(shù)據(jù)對其進行調(diào)教和進化,而最終這套系統(tǒng)到底收不收客戶的錢,就成了一個重要的問題。

這其實是數(shù)據(jù)安全背景下,倡導(dǎo)私有云模式解決問題的AI公司最大的無奈。

即使是已經(jīng)具備完善深入學(xué)習(xí)解決方案,而且在其他企業(yè)都被訓(xùn)練過的AI系統(tǒng),在交付新客戶使用的時候,客戶對自身數(shù)據(jù)的安全擔(dān)憂會更加明顯。

因為當(dāng)下這個被AI公司推出的系統(tǒng)精確度非常高,就意味著他們使用了以往客戶的數(shù)據(jù),而新客戶的數(shù)據(jù)是否被使用,就成了一個無法被保證的問題。

這種信用上的尷尬,有時候會引發(fā)行業(yè)客戶訂單的雪崩。

#04

等待進化

業(yè)內(nèi)人士認為,在國家注重數(shù)據(jù)安全的背景下,四小龍唯一可行解決的辦法,就是將行業(yè)普遍的AI系統(tǒng)轉(zhuǎn)換成定制系統(tǒng)開發(fā)的產(chǎn)品。

因為不針對行業(yè)推出產(chǎn)品,而只為單獨客戶定制和開發(fā)AI系統(tǒng),所有的數(shù)據(jù)安全則由客戶本身承擔(dān),這樣可以完美繞過國家對數(shù)據(jù)安全設(shè)下的防線。

但這5年的實際操作過程告訴我們, AI四小龍面前這條看似走得通的路,實際上是一條不歸路。

因為每一個AI企業(yè)的下游都有不同的行業(yè),以云從科技為例,金融、安防、交通等都有要服務(wù)的客戶,應(yīng)用的場景就更多了。而不同的場景適用的AI模型、底層算法都不同,如何讓技術(shù)和操作系統(tǒng)最貼合某一個場景,需要不斷地探索。

現(xiàn)在的人工智能處于發(fā)展初期,相關(guān)技術(shù)和應(yīng)用場景的定制化解決方案迭代速度也比較快,以云從為例,其產(chǎn)品迭代周期一般只有2-6個月。不難看出,AI行業(yè)的研發(fā)是個持續(xù)時間長且投入高的過程。

這同樣也是技術(shù)落地比較難的原因。再加上項目之間有明顯的差異,定制化產(chǎn)品多于標(biāo)準(zhǔn)化產(chǎn)品,成本就會不可避免地往上走,看起來AI是高毛利率的行業(yè),實際上血虧。

這也是為什么四小龍有三家正在上市,公布的財報中全是虧損,而且虧損的幅度在大額上升的重要原因。

況且,《中國成長AI企業(yè)研究報告》指出,人工智能領(lǐng)域巨頭盤踞,業(yè)界的龍頭企業(yè)往往會向市場開放框架或者算法技術(shù)臺發(fā)展,為更多的企業(yè)提供基礎(chǔ)支撐,而一些市場規(guī)模還不大的細化場景,巨頭公司基本上不會涉足。

這意味行業(yè)不夠大,企業(yè)自身的發(fā)展受限制,行業(yè)足夠大,又容易引來巨頭。

所以,數(shù)據(jù)安全被國家重視之后,AI四小龍的一切商業(yè)模式都等待著進化。

因為,不變就可能會“死”。

標(biāo)簽: 中國AI四小龍 證券市場 曠視科技 商湯科技

推薦

財富更多》

動態(tài)更多》

熱點