#本文由作者授權(quán)發(fā)布,未經(jīng)作者許可,禁止轉(zhuǎn)載,文章不代表IPRdaily立場(chǎng)#
發(fā)布:IPRdaily中文網(wǎng)(IPRdaily.cn)
供稿:方象知產(chǎn)研究院
原標(biāo)題:起底AI黑科技:計(jì)算機(jī)視覺技術(shù)專利分析
自4月4日起警方多次在張學(xué)友演唱會(huì)現(xiàn)場(chǎng)抓捕到癡迷歌神的逃犯,什么是人臉識(shí)別系統(tǒng)?人臉識(shí)別這么強(qiáng)大?計(jì)算機(jī)也像人類一樣擁有視覺了?一時(shí)間計(jì)算機(jī)視覺成為繼AlphaGo之后人們最為關(guān)注的科技熱點(diǎn)。本文挖掘背后的蓬勃發(fā)展的黑科技--計(jì)算機(jī)視覺,并從專利的角度為您解讀這項(xiàng)黑科技的發(fā)展趨勢(shì)。
起底AI黑科技:計(jì)算機(jī)視覺技術(shù)專利分析(一)
內(nèi)容提要:
1.美國計(jì)算機(jī)視覺行業(yè)領(lǐng)跑,世界競(jìng)爭(zhēng)格局真得難以撼動(dòng)嗎?
2.計(jì)算機(jī)視覺能否讓中國“看”到行業(yè)發(fā)展“黃金時(shí)期”?
3.計(jì)算機(jī)視覺創(chuàng)業(yè)潮下,國內(nèi)競(jìng)爭(zhēng)格局尚未形成,如何成為明日之星?
引言
近期一則新聞引起大家的關(guān)注和熱議,自4月4日起警方多次在張學(xué)友演唱會(huì)現(xiàn)場(chǎng)抓捕到癡迷歌神的逃犯,逃犯?jìng)兟渚W(wǎng)后紛紛表示,沒想到自己藏身茫茫人海中還能被人臉識(shí)別系統(tǒng)發(fā)現(xiàn),早知道這樣就不來了…
圖1 人臉識(shí)別抓逃犯
什么是人臉識(shí)別系統(tǒng)?人臉識(shí)別這么強(qiáng)大?計(jì)算機(jī)也像人類一樣擁有視覺了?一時(shí)間計(jì)算機(jī)視覺成為繼AlphaGo之后人們最為關(guān)注的科技熱點(diǎn)。方象知產(chǎn)研究院順著這一備受關(guān)注的事件,挖掘背后的蓬勃發(fā)展的黑科技--計(jì)算機(jī)視覺,并從專利的角度為您解讀這項(xiàng)黑科技的發(fā)展趨勢(shì)。
1、計(jì)算機(jī)視覺是什么?
人臉識(shí)別系統(tǒng)是計(jì)算機(jī)視覺的一項(xiàng)重要應(yīng)用,一般認(rèn)為計(jì)算機(jī)視覺就是“賦予機(jī)器自然視覺能力”的一門學(xué)科,也可以說是以圖像(視頻)為輸入,以對(duì)環(huán)境的表達(dá)和理解為目標(biāo),研究圖像信息組織、物體和場(chǎng)景識(shí)別、進(jìn)而對(duì)事件給予解釋的學(xué)科。計(jì)算機(jī)視覺與視覺感知、視覺認(rèn)知、圖像和視頻理解等概念密切相關(guān),研究范圍有很多交叉卻又不完全相同。
計(jì)算機(jī)視覺是人工智能的一個(gè)重要的分支,自然與人工智能也有密切聯(lián)系,但同時(shí)與常見的強(qiáng)調(diào)推理和決策的人工智能系統(tǒng)不同,計(jì)算機(jī)視覺主要研究圖像信息表達(dá)和物體識(shí)別。雖然物體識(shí)別和場(chǎng)景理解也涉及圖像特征的推理與決策,但與主流人工智能系統(tǒng)的推理和決策有著本質(zhì)的區(qū)別。
圖2 計(jì)算機(jī)視覺及相關(guān)領(lǐng)域
數(shù)據(jù)來源:方象知產(chǎn)研究院整理
計(jì)算機(jī)視覺的研究內(nèi)容,主要分為物體視覺和空間視覺二大部分。物體視覺在于對(duì)物體進(jìn)行精細(xì)分類和鑒別,而空間視覺在于確定物體的位置和形狀,為動(dòng)作服務(wù)。
2、計(jì)算機(jī)視覺發(fā)展簡史
到目前為止,計(jì)算機(jī)視覺的發(fā)展經(jīng)過了4個(gè)主要的階段:分別是馬爾計(jì)算視覺、主動(dòng)和目的視覺、多視幾何與分層三維重建和基于學(xué)習(xí)的視覺。為了便于分析計(jì)算機(jī)視覺行業(yè)的脈絡(luò),下面做一個(gè)簡要的梳理。
(一) 馬爾計(jì)算視覺
1982年馬爾的《視覺》一書問世,書中將計(jì)算機(jī)視覺分為計(jì)算理論、表達(dá)和算法以及算法實(shí)現(xiàn)三個(gè)層次,不論在理論上還是研究計(jì)算機(jī)視覺的方法論上,均具有劃時(shí)代的意義,標(biāo)志著計(jì)算機(jī)視覺成為了一門獨(dú)立學(xué)科。由于馬爾認(rèn)為算法實(shí)現(xiàn)并不影響算法的功能和效果,所以馬爾計(jì)算視覺理論主要討論計(jì)算理論和表達(dá)與算法二部分內(nèi)容。
1.計(jì)算理論
馬爾計(jì)算理論認(rèn)為視覺的核心能力在于通過視網(wǎng)膜成像的二維圖像來恢復(fù)空間物體的可見三維表面形狀,也就是所謂的三維重建,而且生物的視覺能力可以通過計(jì)算機(jī)來實(shí)現(xiàn)。由于二維圖像是真實(shí)物理世界的投影,計(jì)算機(jī)視覺的計(jì)算理論應(yīng)該從圖像出發(fā),充分挖掘圖像所蘊(yùn)含的物理空間的內(nèi)在屬性和關(guān)聯(lián)信息,并運(yùn)用先驗(yàn)知識(shí)完成相應(yīng)的視覺問題計(jì)算,解釋看到的場(chǎng)景和指導(dǎo)相應(yīng)的行動(dòng)。
2.表達(dá)和算法
馬爾視覺計(jì)算理論認(rèn)為,計(jì)算機(jī)識(shí)別物體之前,系統(tǒng)中要有對(duì)該物體三維幾何形狀的存儲(chǔ)形式,稱之為物體表達(dá)。首先從圖像中提取邊緣信息,然后提取點(diǎn)狀基元、線狀基元和桿狀基元, 通過對(duì)這些初級(jí)基元組合形成完整基元,完成視覺計(jì)算理論的特征提取。其次,在完整基元基礎(chǔ)上,通過立體視覺和運(yùn)動(dòng)視覺等模塊,將基元提升到2.5維物體表達(dá)。最后,將2.5維物體表達(dá)提升到三維物體表達(dá)。
圖3 物體表達(dá)的過程
數(shù)據(jù)來源:方象知產(chǎn)研究院整理
馬爾構(gòu)建了一種計(jì)算機(jī)視覺理論體系,可以通過不斷豐富具體的計(jì)算模塊完善“通用性視覺系統(tǒng)”。為紀(jì)念馬爾的卓越貢獻(xiàn),國際計(jì)算機(jī)視覺大會(huì)設(shè)立馬爾獎(jiǎng)作為最佳論文獎(jiǎng),是計(jì)算機(jī)視覺領(lǐng)域最高榮譽(yù)之一。
(二)主動(dòng)和目的視覺
在隨后的工程實(shí)踐中,人們發(fā)現(xiàn)基于馬爾理論的計(jì)算機(jī)視覺存在一些不足,一是在很多應(yīng)用場(chǎng)合并不需要嚴(yán)格三維建模,馬爾計(jì)算視覺方法代價(jià)過高;二是馬爾計(jì)算視覺的魯棒性不足,難以廣泛應(yīng)用。
因此,一些學(xué)者提出了“主動(dòng)視覺”、“目的和定性視覺”、“應(yīng)用視覺”等概念,試圖改進(jìn)馬爾計(jì)算視覺理論缺乏目的性和主動(dòng)性的問題。這個(gè)階段的研究仍然是在馬爾計(jì)算視覺的理論框架之下的改良,缺乏創(chuàng)新的框架、理論和方法,也沒有對(duì)計(jì)算機(jī)視覺后續(xù)研究形成持續(xù)的影響。
(三)多視幾何和分層三維重建
上世紀(jì)90年代視頻會(huì)議、虛擬現(xiàn)實(shí)、視頻監(jiān)控等具體應(yīng)用有力的牽引了計(jì)算機(jī)視覺的發(fā)展,同時(shí)研究發(fā)現(xiàn)基于多視幾何理論下的分層三維重建能有效提高三維重建的魯棒性和精度,而計(jì)算機(jī)技術(shù)的飛速發(fā)展也給分層三維重建提供了有利的計(jì)算能力支撐。
1.多視幾何
“多視幾何”本質(zhì)上是研究射影變換下圖像對(duì)應(yīng)點(diǎn)之間以及空間點(diǎn)與其投影的圖像點(diǎn)之間的約束理論和計(jì)算方法的學(xué)科,將多視幾何理論引入到計(jì)算機(jī)視覺中,提出了分層三維重建理論和攝像機(jī)自標(biāo)定理論,豐富了馬爾計(jì)算視覺的三維重建理論,提高了三維重建的魯棒性和對(duì)大數(shù)據(jù)的適應(yīng)性,有力推動(dòng)了三維重建的應(yīng)用范圍。所以,計(jì)算機(jī)視覺中的多視幾何研究,是計(jì)算機(jī)視覺發(fā)展歷程中的一個(gè)重要階段和事件。
圖4 多視幾何
數(shù)據(jù)來源:方象知產(chǎn)研究院整理
2.分層三維重建
分層三維重建,是指從多幅二維圖像恢復(fù)歐氏空間的三維結(jié)構(gòu)時(shí),不是從圖像一步到歐氏空間下的三維結(jié)構(gòu),而是分步分層地進(jìn)行。首先進(jìn)行射影重建,從多幅圖像的對(duì)應(yīng)點(diǎn)重建射影空間下的對(duì)應(yīng)空間點(diǎn);其次進(jìn)行仿射重建,把射影空間下重建的點(diǎn)提升到仿射空間下;最后把仿射空間下重建的點(diǎn)再提升到歐氏空間或度量空間。
圖5 分層三維重建
數(shù)據(jù)來源:方象知產(chǎn)研究院整理
分層三維重建將十分困難的非線性優(yōu)化視覺問題轉(zhuǎn)化為相對(duì)簡單的分段線性優(yōu)化問題,從而大大減小了三維重建的計(jì)算復(fù)雜度。分層三維重建理論是計(jì)算機(jī)視覺領(lǐng)域又一個(gè)最重要和最具有影響力的理論,是很多重要三維視覺應(yīng)用的后臺(tái)核心技術(shù)。
(四)基于學(xué)習(xí)的視覺
基于學(xué)習(xí)的視覺包括流形學(xué)習(xí)方法和深度學(xué)習(xí)方法。
1.流形學(xué)習(xí)
流形學(xué)習(xí)理論認(rèn)為一種圖像物體存在其內(nèi)在流形,這種內(nèi)在流形解決了直接用圖像像素作為表達(dá)的“過表達(dá)”問題,是一種優(yōu)秀的物體表達(dá)方法,解決了物體識(shí)別的核心問題。
流形學(xué)習(xí)就是通過圖像表達(dá)學(xué)習(xí)其內(nèi)在流形表達(dá)的過程,這種內(nèi)在流形的學(xué)習(xí)過程一般是一種非線性優(yōu)化過程。流形學(xué)習(xí)一個(gè)困難的問題是沒有嚴(yán)格的理論來確定內(nèi)在流形的維度,此外流形學(xué)習(xí)的效果因問題而異,很多時(shí)候其識(shí)別率甚至不如傳統(tǒng)的主元分析等傳統(tǒng)方法。
圖6 流形學(xué)習(xí)
數(shù)據(jù)來源:方象知產(chǎn)研究院整理
2.深度學(xué)習(xí)
深度網(wǎng)絡(luò)的概念最早可以追朔到上世紀(jì)80年代,但是受限于當(dāng)時(shí)的數(shù)據(jù)規(guī)模和計(jì)算能力,深度網(wǎng)絡(luò)的能力反而不如淺層網(wǎng)絡(luò),因此沒有得到大的發(fā)展。今年來隨著數(shù)據(jù)積累和計(jì)算能力的大幅提升,基于深度學(xué)習(xí)的計(jì)算機(jī)視覺研究爆炸式發(fā)展,在應(yīng)用領(lǐng)域也取得了豐富的成果,前文提到抓捕逃犯的人臉識(shí)別系統(tǒng)就是基于深度學(xué)習(xí)的具體行業(yè)應(yīng)用。
盡管深度學(xué)習(xí)在圖像識(shí)別方面取得了革命性進(jìn)步,但是一方面關(guān)于其算法自身的科學(xué)解釋缺乏系統(tǒng)性的理論基礎(chǔ),另一方面深度學(xué)習(xí)在物體定位方面仍無法與基于幾何的方法相媲美。
圖7 深度學(xué)習(xí)
數(shù)據(jù)來源:方象知產(chǎn)研究院整理
3、全球計(jì)算機(jī)視覺技術(shù)專利申請(qǐng)狀況分析
圖8 計(jì)算機(jī)視覺技術(shù)全球?qū)@暾?qǐng)量年變化趨勢(shì)
數(shù)據(jù)來源:方象知產(chǎn)研究院整理
圖8 是計(jì)算機(jī)視覺技術(shù)全球申請(qǐng)量年度變化情況。從圖中可以看出,全球?qū)@暾?qǐng)量呈現(xiàn)上升的趨勢(shì),至今沒有達(dá)到最高峰值,表明計(jì)算機(jī)視覺技術(shù)沒有達(dá)到鼎盛時(shí)期,還具有很大的發(fā)展?jié)摿?。值得關(guān)注的是,以2000年作為時(shí)間節(jié)點(diǎn),此前世界專利申請(qǐng)量基本處于穩(wěn)定狀態(tài),而此后基本處于大幅增長趨勢(shì),尤其是2015年之后專利申請(qǐng)量驟升。據(jù)相關(guān)資料顯示,計(jì)算機(jī)視覺技術(shù)自2000年開始逐步邁入第四發(fā)展階段。在該時(shí)期內(nèi),計(jì)算機(jī)視覺能力得到極大提升,這得益于以下兩方面原因:一是深度學(xué)習(xí)算法和傳感器技術(shù)的發(fā)展,以及神經(jīng)網(wǎng)絡(luò)技術(shù)等新方法的運(yùn)用;二是相關(guān)應(yīng)用領(lǐng)域的急劇擴(kuò)張,特別是計(jì)算機(jī)視覺技術(shù)在2015年已超過人類水平,迎來廣泛應(yīng)用。
圖9 計(jì)算機(jī)視覺技術(shù)申請(qǐng)目標(biāo)國/地區(qū)比例分布
數(shù)據(jù)來源:方象知產(chǎn)研究院整理
圖10 計(jì)算機(jī)視覺技術(shù)申請(qǐng)?jiān)瓌?chuàng)國/地區(qū)比例分布
數(shù)據(jù)來源:方象知產(chǎn)研究院整理
圖9和圖10 分別是計(jì)算機(jī)視覺技術(shù)申請(qǐng)目標(biāo)國和原創(chuàng)國的分布占比情況。從兩圖中可以看出,計(jì)算機(jī)視覺技術(shù)目標(biāo)國/地區(qū)和原創(chuàng)國/地區(qū)均為世界知識(shí)產(chǎn)權(quán)五大國/地區(qū),即中國、美國、日本、韓國和歐洲,且占比排序基本一致。其中,中國處于計(jì)算機(jī)視覺技術(shù)原創(chuàng)國/地區(qū)和目標(biāo)國/地區(qū)的首位,其專利量大幅領(lǐng)先其他各國,分別占全球申請(qǐng)量的55.86%和54.88%,其次為美國,分別占比23.87%和32.56%,再次為歐洲和韓國,最后為日本。這與計(jì)算機(jī)視覺技術(shù)的市場(chǎng)分布情況一致。
人臉識(shí)別和視頻監(jiān)控作為計(jì)算機(jī)視覺技術(shù)的重要應(yīng)用領(lǐng)域,具有更加豐富的應(yīng)用場(chǎng)景,已然成為計(jì)算機(jī)視覺技術(shù)的主流。據(jù)Capvision對(duì)相關(guān)企業(yè)營收的估算數(shù)據(jù)顯示,2015年全球人臉識(shí)別市場(chǎng)規(guī)模已達(dá)200億,中國約為70億;而全球監(jiān)控領(lǐng)域視覺識(shí)別市場(chǎng)容量約為740億,中國約為200億。據(jù)iMedia Research預(yù)計(jì),2020年市場(chǎng)規(guī)模達(dá)到780億元,年均復(fù)合增長率達(dá)125.5%.另外,從各原創(chuàng)國/地區(qū)和目標(biāo)國/地區(qū)的占比分析,明顯可以判斷中國即是技術(shù)創(chuàng)新水平較高的國家,又是各國申請(qǐng)人最為重視的市場(chǎng)。
在國內(nèi)良好政策環(huán)境的激勵(lì)下,我國計(jì)算機(jī)視覺技術(shù)逐漸成熟。2015年以來,我國相繼出臺(tái)支持人工智能行業(yè)發(fā)展的政策,加速了計(jì)算機(jī)視覺技術(shù)創(chuàng)新應(yīng)用的發(fā)展,提升了商業(yè)化落地能力,市場(chǎng)發(fā)展空間巨大。
圖11 全球計(jì)算機(jī)視覺技術(shù)IPC分類號(hào)分布
數(shù)據(jù)來源:方象知產(chǎn)研究院整理
圖11顯示了全球計(jì)算機(jī)視覺技術(shù)的IPC分類號(hào)分布情況。根據(jù)小類統(tǒng)計(jì)分布情況知,G06K(數(shù)據(jù)識(shí)別,占比24.68%)、G06T(一般的圖像數(shù)據(jù)處理或產(chǎn)生,占比23.28%)、G06F(電數(shù)字?jǐn)?shù)據(jù)處理,占比10.69%)和H04N(圖像通信,占比7.94%)占比分別位列前四,說明相關(guān)技術(shù)主要涉及以電為表征的數(shù)字?jǐn)?shù)據(jù)信號(hào)處理和圖像通信。這也表明相當(dāng)數(shù)量的計(jì)算機(jī)視覺技術(shù)專利均涉及數(shù)據(jù)識(shí)別和圖像處理等細(xì)分領(lǐng)域,且成為世界在計(jì)算機(jī)視覺領(lǐng)域中的研究方向和關(guān)注熱點(diǎn)。這也符合計(jì)算機(jī)視覺技術(shù)應(yīng)用場(chǎng)景的發(fā)展現(xiàn)狀。隨著身份識(shí)別的應(yīng)用場(chǎng)景被開拓延伸,生物特征識(shí)別市場(chǎng)不斷得到開發(fā),可預(yù)期指紋識(shí)別、靜脈識(shí)別、虹膜識(shí)別、語音識(shí)別等生物識(shí)別技術(shù)的相關(guān)專利申請(qǐng)將會(huì)逐漸增加。
從圖11還可以看出,G01B(長度、厚度或類似線性尺寸、角度、面積等的計(jì)量)、G01C(測(cè)量距離、水準(zhǔn)或者方位;通過利用無線電波的傳播效應(yīng)測(cè)定距離或速度)和G01N(利用光學(xué)手段測(cè)試)的占比在第五到第七位??梢娫诋?dāng)前申請(qǐng)專利中,涉及較多的物體形狀和方位確定等相關(guān)技術(shù),因?yàn)閳?chǎng)景分析與判斷也是計(jì)算機(jī)視覺系統(tǒng)的主要解決問題之一。
4、中國計(jì)算機(jī)視覺技術(shù)專利申請(qǐng)狀況分析
圖12 中國和美國的計(jì)算機(jī)視覺領(lǐng)域技術(shù)專利申請(qǐng)量的年變化
數(shù)據(jù)來源:方象知產(chǎn)研究院整理
圖13 中國計(jì)算機(jī)視覺領(lǐng)域細(xì)分技術(shù)的年度分布
數(shù)據(jù)來源:方象知產(chǎn)研究院整理
圖12和圖13分別為計(jì)算機(jī)視覺領(lǐng)域中各分支技術(shù)的中國專利申請(qǐng)量年變化趨勢(shì)及申請(qǐng)年度分布情況。從圖12中可以看出,中國的計(jì)算機(jī)視覺技術(shù)的專利申請(qǐng)始于1990年,比全球起步晚了近10年(見圖8)。但是,中國專利的年均申請(qǐng)量均高于美國,這說明我國雖然起步較晚,但是具有一定的研發(fā)基礎(chǔ)和實(shí)力。
直至2005 年,我國專利申請(qǐng)量才開始出現(xiàn)較大幅度增長,各分支技術(shù)年均申請(qǐng)總量約達(dá)116件。且此后一直保持高速增長的趨勢(shì),這與計(jì)算機(jī)視覺技術(shù)在國內(nèi)的發(fā)展愈發(fā)火熱有關(guān)。從國際環(huán)境方面來看,自2011年起,全球大數(shù)據(jù)資源為計(jì)算機(jī)視覺算法模型提供源源不斷的素材。另外,GPU的出現(xiàn)使得運(yùn)算力大幅度提升,這均有助于推進(jìn)計(jì)算機(jī)視覺技術(shù)的發(fā)展。從國內(nèi)政策層面分析,國內(nèi)相繼頒布的利好政策,促進(jìn)了計(jì)算機(jī)視覺基礎(chǔ)技術(shù)的研發(fā)和應(yīng)用。所以,國內(nèi)的計(jì)算機(jī)視覺領(lǐng)域的企業(yè)不斷涌現(xiàn),至今熱度不減。
從圖13 所示計(jì)算機(jī)視覺技術(shù)分布來看,我國幾乎同時(shí)開啟G06K、G06T、G06F、H04N、G01B、G01C和G01N等細(xì)分技術(shù)的研究,這幾項(xiàng)技術(shù)和計(jì)算機(jī)視覺系統(tǒng)的各場(chǎng)景應(yīng)用密切相關(guān),說明中國對(duì)于計(jì)算技術(shù)視覺領(lǐng)域的各分支技術(shù)均有關(guān)注,且相關(guān)研究較為系統(tǒng)化。其中,從2013年至今G06K和G06T的申請(qǐng)大幅增加,且所占比重較大,這與生物識(shí)別成為計(jì)算機(jī)視覺的主流應(yīng)用有關(guān)。
圖14 計(jì)算機(jī)視覺技術(shù)全球?qū)@暾?qǐng)人排名
數(shù)據(jù)來源:方象知產(chǎn)研究院整理
圖14是計(jì)算機(jī)視覺技術(shù)的全球?qū)@暾?qǐng)人排名。從圖14可以看出,在排名前十一位的申請(qǐng)人中,大多數(shù)為中國申請(qǐng)人,有4家美國企業(yè)入榜。其中,我國的申請(qǐng)機(jī)構(gòu)基本為高校,僅有成都通甲優(yōu)博科技一家企業(yè),且大連理工大學(xué)的申請(qǐng)量獨(dú)占鰲頭,其申請(qǐng)量高達(dá)110件。據(jù)公開資料顯示,目前我國從事計(jì)算機(jī)視覺技術(shù)的公司有104個(gè),國內(nèi)知名的創(chuàng)業(yè)公司有商湯科技、云從科技、依圖科技、創(chuàng)視科技等,且發(fā)展均處于偏早期。這表明我國的計(jì)算技術(shù)視覺產(chǎn)業(yè)的市場(chǎng)比較分散,且核心技術(shù)集中于高校的現(xiàn)實(shí)與企業(yè)發(fā)展的技術(shù)實(shí)際需求不匹配。
與中國相關(guān)情況不同,美國的主要申請(qǐng)機(jī)構(gòu)均是耳熟能詳?shù)墓I(yè)科技界巨頭,包括高通、微軟、飛利浦和pointgrab等。同時(shí),美國著名高校也設(shè)立了計(jì)算機(jī)視覺相關(guān)實(shí)驗(yàn)室,如斯坦福計(jì)算機(jī)視覺實(shí)驗(yàn)室、麻省理工媒體實(shí)驗(yàn)室等。相關(guān)企業(yè)作為工業(yè)或互聯(lián)網(wǎng)界的寡頭,依靠計(jì)算機(jī)視覺技術(shù)商業(yè)化的盈利壓力較小。所以,通過深耕技術(shù)研發(fā),擁有引領(lǐng)性技術(shù)無疑會(huì)帶給企業(yè)強(qiáng)大的競(jìng)爭(zhēng)力。而且,國外IT巨頭紛紛開啟并購狂潮,通過布局計(jì)算視覺關(guān)鍵技術(shù)領(lǐng)域全產(chǎn)業(yè)鏈,挖掘計(jì)算機(jī)視覺市場(chǎng)潛力。
面對(duì)日益激烈的國際競(jìng)爭(zhēng)環(huán)境,盡管目前我國的計(jì)算機(jī)視覺企業(yè)占據(jù)較大市場(chǎng)份額,但若要持續(xù)保持競(jìng)爭(zhēng)優(yōu)勢(shì),需要加強(qiáng)專利的市場(chǎng)競(jìng)爭(zhēng)力。云從科技孵化于中國科學(xué)院重慶研究院,這是高?;蚩蒲性核?wù)企業(yè)的典型成功案例。故可嘗試通過聯(lián)合高校核心技術(shù)發(fā)明人資源,推動(dòng)高校中強(qiáng)大技術(shù)和專利儲(chǔ)備資源商業(yè)化落地,助力形成技術(shù)和企業(yè)相互支撐的格局。
5、結(jié)論與建議
計(jì)算機(jī)視覺技術(shù)經(jīng)過幾年的飛速發(fā)展,已成功應(yīng)用于眾多場(chǎng)景領(lǐng)域,成為了世界各國爭(zhēng)相角逐的藍(lán)海市場(chǎng)。尤其是近年來深度學(xué)習(xí)方法的發(fā)展,提升了計(jì)算機(jī)視覺的準(zhǔn)確度,使得計(jì)算機(jī)視覺技術(shù)的應(yīng)用價(jià)值得到進(jìn)一步體現(xiàn),市場(chǎng)競(jìng)爭(zhēng)也日趨激烈。我國雖具有專利申請(qǐng)量的優(yōu)勢(shì),然而國際上工業(yè)或互聯(lián)網(wǎng)巨頭也紛紛局計(jì)算機(jī)視覺技術(shù),若要在市場(chǎng)競(jìng)爭(zhēng)中取得領(lǐng)先優(yōu)勢(shì),我們必須掌握行業(yè)關(guān)鍵技術(shù)、增強(qiáng)企業(yè)核心競(jìng)爭(zhēng)力,激發(fā)計(jì)算機(jī)視覺產(chǎn)業(yè)蓬勃發(fā)展的活力。
盡管計(jì)算機(jī)視覺技術(shù)發(fā)端于學(xué)術(shù)界,但是唯有進(jìn)行商業(yè)化應(yīng)用,解決視覺識(shí)別的實(shí)際問題,才能成為計(jì)算機(jī)視覺公司的核心競(jìng)爭(zhēng)力。所以,在提高專利申請(qǐng)量的同時(shí),需更加注重專利的商業(yè)化應(yīng)用,產(chǎn)生更高的經(jīng)濟(jì)效益,力爭(zhēng)量價(jià)齊升。
首先,我國應(yīng)充分發(fā)揮高校和科研院所在國家科技創(chuàng)新體系中的作用。在現(xiàn)有技術(shù)研發(fā)基礎(chǔ)上,進(jìn)一步加大創(chuàng)新力度,推動(dòng)技術(shù)革新,創(chuàng)造出新穎、實(shí)用的核心專利,助力國家核心技術(shù)競(jìng)爭(zhēng)實(shí)力。另外,可嘗試推動(dòng)高??萍汲晒D(zhuǎn)化的相關(guān)措施,如選擇與擁有核心技術(shù)的高?;蚩蒲性核献?,擇取一個(gè)商業(yè)落地的方向,實(shí)現(xiàn)技術(shù)的經(jīng)濟(jì)效益。同時(shí),這也是推動(dòng)我國科技創(chuàng)新和產(chǎn)業(yè)生態(tài)融合發(fā)展的具體舉措。
起底AI黑科技:計(jì)算機(jī)視覺技術(shù)專利分析(二)
內(nèi)容提要:
1.計(jì)算機(jī)視覺技術(shù)的重要應(yīng)用領(lǐng)域介紹;
2.國內(nèi)領(lǐng)跑企業(yè)融資和專利技術(shù)分析;
3.方象知產(chǎn)短評(píng)。
引言
上文中,我院介紹了計(jì)算機(jī)視覺技術(shù)概要和專利視角下的全球技術(shù)競(jìng)爭(zhēng)格局,本期文章將繼續(xù)深挖計(jì)算機(jī)視覺技術(shù)的技術(shù)投融資信息、前沿技術(shù)競(jìng)爭(zhēng)情報(bào)和產(chǎn)業(yè)發(fā)展趨勢(shì)。
1、計(jì)算機(jī)視覺的重要應(yīng)用領(lǐng)域
隨著信息化、智能化時(shí)代的到來,計(jì)算機(jī)視覺也在我們工作和生活中有了越來越廣泛的應(yīng)用,當(dāng)前及未來一段時(shí)間內(nèi),計(jì)算機(jī)視覺在人臉識(shí)別、醫(yī)學(xué)影像診斷、無人駕駛等領(lǐng)域的應(yīng)用將蓬勃發(fā)展,下面方象知產(chǎn)研究院盤點(diǎn)計(jì)算機(jī)視覺最熱門、最重要的幾個(gè)應(yīng)用領(lǐng)域。
(一)人臉識(shí)別
人臉識(shí)別是當(dāng)今計(jì)算機(jī)視覺和人工智能最熱門、最成熟的應(yīng)用,該項(xiàng)技術(shù)目前已經(jīng)廣泛應(yīng)用于公安、司法、金融、政府、航天、電力、工廠、教育、醫(yī)療等行業(yè),并且有越來越多的行業(yè)將引入該項(xiàng)技術(shù)。從世界范圍來看人臉識(shí)別產(chǎn)業(yè)的需求旺盛,研究機(jī)構(gòu)和企業(yè)投入資金持續(xù)推動(dòng)研究。目前該技術(shù)識(shí)別率很高,已具備大規(guī)模商用的條件,未來幾年將迎來高速增長。
(二)醫(yī)療影像診斷
據(jù)統(tǒng)計(jì),醫(yī)療數(shù)據(jù)中有超過 90%來自醫(yī)療影像,醫(yī)療影像信息是醫(yī)生判斷病情、做出治療方案的極為重要依據(jù)。與此同時(shí),高水平閱片醫(yī)生的缺乏和繁重的閱片工作嚴(yán)重的影響了對(duì)患者病情的正確診斷、制約了醫(yī)療資源的高效利用。目前很多學(xué)者針對(duì)這個(gè)問題開展了研究,并取得了卓越的成果,在識(shí)別病理組織切片診斷早期肺癌方面,基于深度學(xué)習(xí)的計(jì)算機(jī)視覺系統(tǒng)的準(zhǔn)確率甚至超過了人類專家。隨著人們對(duì)健康的日益重視,可以預(yù)計(jì)未來基于計(jì)算機(jī)視覺的醫(yī)療影像診斷將有爆發(fā)式發(fā)展。
(三)無人駕駛
隨著各種無人系統(tǒng)(無人車、無人機(jī))的普及,帶有視覺傳感器的汽車、飛行器成為了計(jì)算機(jī)視覺技術(shù)非常大的應(yīng)用投放方向。雖然從目前來看,完全實(shí)現(xiàn)自動(dòng)駕駛、自主駕駛、無人駕駛在技術(shù)上尚不成熟,但是無人駕駛能夠帶來的效率和效益的巨大提升,尤其是在軍事、重工業(yè)、搶險(xiǎn)救災(zāi)等領(lǐng)域能夠消除人類面臨的種種危險(xiǎn),促使相關(guān)部門和機(jī)構(gòu)投入大量資金發(fā)展該項(xiàng)技術(shù)。
(四)視頻監(jiān)控和分析
結(jié)合人工智能的計(jì)算機(jī)視覺技術(shù)可以對(duì)結(jié)構(gòu)化的人、車、物等視頻內(nèi)容信息進(jìn)行快速檢索、識(shí)別和分析。這項(xiàng)應(yīng)用為公安系統(tǒng)在海量監(jiān)控視頻中搜尋到特定罪犯提供了技術(shù)上的可能,同時(shí)也被廣泛應(yīng)用于人流密集地區(qū)的態(tài)勢(shì)監(jiān)控、緊急預(yù)警、人群分析等。視頻監(jiān)控和分析領(lǐng)域的商業(yè)模式多種多樣,具備廣闊的盈利空間,計(jì)算機(jī)視覺的該項(xiàng)應(yīng)用將率先在安防、交通以及零售等行業(yè)掀起熱潮。
2、從融資和專利角度看計(jì)算機(jī)視覺行業(yè)現(xiàn)狀與趨勢(shì)
計(jì)算機(jī)視覺這樣一項(xiàng)有著廣泛應(yīng)用場(chǎng)景的高科技必然會(huì)涉及知識(shí)產(chǎn)權(quán)領(lǐng)域的申請(qǐng)、保護(hù)、交易和布局等問題,方象知產(chǎn)研究院從專利的角度分析計(jì)算機(jī)視覺行業(yè)的現(xiàn)狀和趨勢(shì)。
(一) 人臉識(shí)別:Face++曠視科技、廣州云從科技、依圖科技、商湯科技
國內(nèi)人臉識(shí)別技術(shù)最強(qiáng)的企業(yè)有哪些?各種排行不盡一致,不過獲得比較一致認(rèn)可的排在前四位的公司分別是商湯科技、曠視科技、廣州云從科技和依圖科技。這幾個(gè)公司的基本信息、融資情況和專利申請(qǐng)情況見表1:
表1 國內(nèi)人臉識(shí)別技術(shù)重點(diǎn)企業(yè)融資和專利申請(qǐng)信息表
數(shù)據(jù)來源:方象知產(chǎn)研究院整理
從表1中的融資情況可以看出人臉識(shí)別技術(shù)行業(yè)作為計(jì)算機(jī)視覺和人工智能最成熟的應(yīng)用領(lǐng)域在當(dāng)今社會(huì)中的火熱程度,動(dòng)輒都是數(shù)億甚至數(shù)十億融資,特別是商湯科技和曠視科技更是行業(yè)的翹楚。繼去年曠視科技(Face++)獲得由中國國有資本風(fēng)險(xiǎn)投資基金(簡稱“國風(fēng)投”)領(lǐng)投的4.6億美金融資打破AI融資記錄后,商湯科技在今年以6.2億的融資額再破記錄。
圖1 人臉識(shí)別技術(shù)重點(diǎn)企業(yè)相關(guān)專利申請(qǐng)量
數(shù)據(jù)來源:方象知產(chǎn)研究院整理
從表1和圖1還可以看出,曠視科技和商湯科技在人臉識(shí)別技術(shù)方面的專利申請(qǐng)量遠(yuǎn)遠(yuǎn)超過另外兩家企業(yè),特別是曠視科技以85個(gè)相關(guān)專利超過位列第二的商湯科技二十多條,這也許是曠視科技近年在國內(nèi)外風(fēng)頭強(qiáng)勁的一個(gè)因素:2017年6月,曠視入榜“2017全球最具突破性品牌”;2017年7月,曠視獲邀參加李克強(qiáng)總理在中南海主持召開的經(jīng)濟(jì)形勢(shì)座談會(huì);2017年10月,曠視科技在計(jì)算機(jī)視覺國際頂級(jí)會(huì)議(ICCV)中獲得物體檢測(cè)、人體關(guān)鍵點(diǎn)以及Places物體分割等三項(xiàng)比賽的第一名,成為了第一個(gè)在COCO競(jìng)賽中獲得冠軍的中國企業(yè)。
較之曠視科技,商湯科技也毫不示弱,經(jīng)過幾輪大的融資,始終處于總?cè)谫Y額最大、估值最高的人工智能獨(dú)角獸的地位,而且從它的專利地域布局圖來看(圖2),商湯在美國歐洲等地都布局了人工智能方面的專利,并且申請(qǐng)的時(shí)間還相當(dāng)早,從2013年和2014年就開始了,說明了商湯的目標(biāo)從一開始就不僅僅局限在國內(nèi)市場(chǎng)。
圖2 商湯科技人臉識(shí)別專利全球布局圖
數(shù)據(jù)來源:方象知產(chǎn)研究院整理
云從科技號(hào)稱擁有源自計(jì)算機(jī)視覺之父的人臉識(shí)別技術(shù),是人臉識(shí)別國家標(biāo)準(zhǔn)起草和制定企業(yè),從2017年8月至10月期間一口氣申請(qǐng)了12項(xiàng)與人臉識(shí)別相關(guān)的專利,下一步的動(dòng)態(tài)值得關(guān)注。
(二) 醫(yī)療影像診斷:推想科技、雅森科技、匯醫(yī)慧影
表2 國內(nèi)醫(yī)療影像診斷技術(shù)重點(diǎn)企業(yè)融資和專利申請(qǐng)信息表
數(shù)據(jù)來源:方象知產(chǎn)研究院整理
從表2的國內(nèi)醫(yī)療影像診斷技術(shù)重點(diǎn)企業(yè)的融資和專利申請(qǐng)情況可以看出:成立于2006年的雅森科技是國內(nèi)最早專注于醫(yī)學(xué)影像人工智能分析的,但其十多年來的融資并不多,專利也才兩篇,倒是后起之秀的匯醫(yī)慧影和推想科技的表現(xiàn)搶眼些,特別是推想科技不僅獲得的融資額最高,而且在國內(nèi)外積極布局相關(guān)專利。
總體說來,國內(nèi)醫(yī)療影像診斷技術(shù)的融資和專利申請(qǐng)情況不像人臉識(shí)別技術(shù)那么出色,這可能與智能醫(yī)學(xué)影像診斷在數(shù)據(jù)規(guī)范、數(shù)據(jù)智能處理、臨床準(zhǔn)確率以及數(shù)據(jù)隱私保護(hù)中的問題有關(guān)。要突破傳統(tǒng)思維和技術(shù)障礙以達(dá)到實(shí)際的臨床應(yīng)用,醫(yī)學(xué)影像的智能診斷技術(shù)還需要繼續(xù)努力。
(三) 無人駕駛:縱目科技、圖森未來科技、馭勢(shì)科技、佑駕創(chuàng)新
表3 國內(nèi)無人駕駛技術(shù)重點(diǎn)企業(yè)融資和專利申請(qǐng)信息表
數(shù)據(jù)來源:方象知產(chǎn)研究院整理
人工智能下的無人駕駛技術(shù)與人類的出行方式息息相關(guān),因此最受大眾矚目,產(chǎn)業(yè)大鱷和科技巨頭紛紛將無人駕駛技術(shù)視為變革的鑰匙,聚集了龐大的資金和聰明的人才。據(jù)統(tǒng)計(jì),計(jì)算機(jī)視覺/圖像技術(shù)是2017年無人駕駛項(xiàng)目中融資金額最高的,從表3的重點(diǎn)企業(yè)融資情況也可以略見一斑。
圖森未來科技成立雖晚,但它是表3中幾家與計(jì)算機(jī)視覺相關(guān)的無人駕駛技術(shù)重點(diǎn)企業(yè)中累計(jì)融資額最高的,超過五億元,同時(shí)它的相關(guān)專利也不少,有19篇,并且在國內(nèi)和美國都有布局。
與圖森未來科技同年成立的馭勢(shì)科技的融資情況雖不如圖森未來那么亮眼,但是其在2016年和2017年就密集布局了40篇相關(guān)專利(其中四篇在世界知識(shí)產(chǎn)權(quán)組織),申請(qǐng)量是圖森未來的兩倍多,可見其技術(shù)團(tuán)隊(duì)真的是實(shí)力雄厚(馭勢(shì)科技網(wǎng)站上宣傳的就是三支頂尖團(tuán)隊(duì)強(qiáng)強(qiáng)聯(lián)合:源于國際頂尖IT和汽車科技公司的系統(tǒng)團(tuán)隊(duì)、脫胎于中國頂尖計(jì)算機(jī)視覺公司的AI團(tuán)隊(duì)、和代表中國高校無人駕駛最先進(jìn)科研水平的自動(dòng)駕駛技術(shù)團(tuán)隊(duì)),未來的發(fā)展不容小覷。
圖3 無人駕駛重點(diǎn)企業(yè)相關(guān)專利申請(qǐng)量
數(shù)據(jù)來源:方象知產(chǎn)研究院整理
從圖3還可以看出,除了佑駕外,其它幾家企業(yè)2017年的專利申請(qǐng)量都較前兩年有較大幅度增加,說明無人駕駛技術(shù)處于技術(shù)發(fā)展期,其研究開發(fā)力度還將持續(xù)加大,它的市場(chǎng)應(yīng)用前景也值得期待。
(四) 視頻監(jiān)控:商湯科技、格靈深瞳、依圖科技、云天勵(lì)飛、深網(wǎng)視界
表4 國內(nèi)視頻監(jiān)控技術(shù)重點(diǎn)企業(yè)融資和專利申請(qǐng)信息表
數(shù)據(jù)來源:方象知產(chǎn)研究院整理
視頻監(jiān)控是安全防范系統(tǒng)的重要組成部分,身為人臉識(shí)別技術(shù)領(lǐng)軍企業(yè)的商湯科技在視頻監(jiān)控領(lǐng)域也有重要布局,申請(qǐng)了23個(gè)專利,并同樣在多地域布局。另外同樣為人臉識(shí)別技術(shù)重點(diǎn)企業(yè)的依圖科技也在視頻監(jiān)控方面有積極參與。
扣除商湯科技和依圖科技因?yàn)槿四樧R(shí)別技術(shù)的融資情況,其它幾家企業(yè)的融資情況與前幾個(gè)領(lǐng)域相比比較一般。不過云天勵(lì)飛的專利申請(qǐng)量很是搶眼,遠(yuǎn)遠(yuǎn)超過其它幾家企業(yè),這應(yīng)與它宣稱其開發(fā)的第一代動(dòng)態(tài)人像識(shí)別系統(tǒng)具有全球首創(chuàng)“云+端”動(dòng)態(tài)人像智能解決方案,并支持大規(guī)模部署是分不開的。
圖4 視頻監(jiān)控技術(shù)重點(diǎn)企業(yè)相關(guān)專利申請(qǐng)量
數(shù)據(jù)來源:方象知產(chǎn)研究院整理
從圖4的視頻監(jiān)控技術(shù)重點(diǎn)企業(yè)相關(guān)專利申請(qǐng)量情況可以看出,格林深瞳從2014年到2016年專利申請(qǐng)量是穩(wěn)步增加的,但是在2017年卻一篇未有,不知是尚未公開的緣故還是根本就沒有申請(qǐng)。
比較有意思的是商湯科技本身在視頻監(jiān)控方面是有積極布局的,但同時(shí)又跟東方網(wǎng)力公司一起投資了深網(wǎng)視界,說明商湯科技對(duì)視頻監(jiān)控的發(fā)展前景是十分看好的,這或許也解釋了2016年和2017年各公司總的相關(guān)專利申請(qǐng)量居高不下的情況(2017年申請(qǐng)的專利還有可能尚未完全公開)。
總體說來,視頻監(jiān)控技術(shù)不僅出于安防目的被政府機(jī)關(guān)要求應(yīng)用,在民用市場(chǎng)也會(huì)進(jìn)一步滲透和普及,因此它的研發(fā)和應(yīng)用都將持續(xù)發(fā)展。
3、方象知產(chǎn)短評(píng)
在分析了計(jì)算機(jī)視覺領(lǐng)域的發(fā)展、應(yīng)用和專利情況之后,我們可以得到一些結(jié)論。
(一) 計(jì)算機(jī)視覺行業(yè)整體處于迅速發(fā)展階段,應(yīng)用前景廣泛;
(二) 人臉識(shí)別技術(shù)是計(jì)算機(jī)視覺的重要應(yīng)用領(lǐng)域,也是計(jì)算機(jī)視覺專利高發(fā)的領(lǐng)域;
(三) 曠視科技公司是人臉識(shí)別領(lǐng)域代表性企業(yè),擁有85項(xiàng)相關(guān)專利,掌握核心科技,成長狀況良好;
(四) 智能醫(yī)療影像診斷技術(shù)的發(fā)展尚需努力;
(五) 無人駕駛技術(shù)改變?nèi)藗兊某鲂蟹绞?,其廣泛應(yīng)用值得期待;
(六) 視頻監(jiān)控技術(shù)會(huì)持續(xù)發(fā)展,應(yīng)用會(huì)更加普及。
最后要指出的是,計(jì)算機(jī)視覺行業(yè)中技術(shù)固然重要,但是,產(chǎn)業(yè)的切入點(diǎn)、技術(shù)應(yīng)用場(chǎng)景、行業(yè)綜合服務(wù)質(zhì)量也是重中之重。最重要的是解決困擾傳統(tǒng)領(lǐng)域的實(shí)際問題,從而帶來預(yù)期收益。
發(fā)布:IPRdaily中文網(wǎng)(IPRdaily.cn)
供稿:方象知產(chǎn)研究院
編輯:IPRdaily趙珍 校對(duì):IPRdaily縱橫君
推薦閱讀
鏈接未來!「2018全球區(qū)塊鏈知識(shí)產(chǎn)權(quán)峰會(huì)」重磅來襲!
2018年“中國好專利”評(píng)選工作正式開啟(報(bào)名通道)
2018中國·海淀高價(jià)值專利培育大賽正式開啟?。▓?bào)名詳情)
“投稿”請(qǐng)投郵箱“iprdaily@163.com”
「關(guān)于IPRdaily」
IPRdaily成立于2014年,是全球影響力的知識(shí)產(chǎn)權(quán)媒體+產(chǎn)業(yè)服務(wù)平臺(tái),致力于連接全球知識(shí)產(chǎn)權(quán)人,用戶匯聚了中國、美國、德國、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國等15個(gè)國家和地區(qū)的高科技公司、成長型科技企業(yè)IP高管、研發(fā)人員、法務(wù)、政府機(jī)構(gòu)、律所、事務(wù)所、科研院校等全球近50多萬產(chǎn)業(yè)用戶(國內(nèi)25萬+海外30萬);同時(shí)擁有近百萬條高質(zhì)量的技術(shù)資源+專利資源,通過媒體構(gòu)建全球知識(shí)產(chǎn)權(quán)資產(chǎn)信息第一入口。2016年獲啟賦資本領(lǐng)投和天使匯跟投的Pre-A輪融資。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來自方象知產(chǎn)研究院并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:“http://m.globalwellnesspartner.com/”
文章不錯(cuò),犒勞下辛苦的作者吧