西西軟件園多重安全檢測下載網(wǎng)站、值得信賴的軟件下載站!
軟件
軟件
文章
搜索

首頁業(yè)內(nèi)動態(tài) 業(yè)內(nèi)資訊 → 圖像識別可能成為未來世界新的超級入口

圖像識別可能成為未來世界新的超級入口

相關(guān)軟件相關(guān)文章發(fā)表評論 來源:西西整理時間:2013/9/10 16:43:40字體大。A-A+

作者:西西點擊:28次評論:0次標(biāo)簽: 圖像識別

  • 類型:翻譯工具大。4.4M語言:多國語言[中文] 評分:8.3
  • 標(biāo)簽:
立即下載


微信5.0已經(jīng)上線多日,其“掃一掃”功能功能令人印象深刻。它利用圖像識別技術(shù)將傳統(tǒng)的條形碼、二維碼、圖書和CD封面、電影海報等掃描入口全部集成到一起,讓目前所有主流的識別手段都在一個小小的APP內(nèi)觸摸得到。

可以說騰訊這次玩的太“狠”了!它正在打造一種新的超級入口,意圖將所有的線下實物和線上信息通過微信關(guān)聯(lián)起來,所謀甚遠,所圖甚大。然而在筆者看來,因為用戶習(xí)慣需要時間培養(yǎng),以及存在的技術(shù)壁壘,目前微信基于條形碼,二維碼或者封面的掃描只能算是圖像識別超級入口的入門版,那理想中的圖像識別超級入口應(yīng)該是什么樣子呢?

一.什么都可以識別——對應(yīng)用領(lǐng)域無限制。
海量的雜志、海報等平面特征;商品實物、店鋪logo等體特征;衣服、水果蔬菜等不定特征;當(dāng)然還有人臉特征,都要能在苛刻的實用條件下準(zhǔn)確識別。這是對目前人類技術(shù)極限的艱巨挑戰(zhàn),也是所有計算機視覺和模式識別領(lǐng)域的研究者夢寐以求的技術(shù)巔峰。同時,這也對識別數(shù)據(jù)庫提出了極高要求。除了常規(guī)的條形碼二維碼之外,各類常見圖片、商品實物、店鋪logo等的數(shù)據(jù)庫都要完備。理想的圖像識別入口應(yīng)該是用戶生活中常見的一切,即掃即得,世間一切都在掃完之后明了清晰。

二.無論怎么掃都能識別——對用戶行為無限制。
識別的過程中不需要限制用戶必須正面對準(zhǔn)、完全框住、不能遠離或貼近、不能傾斜、不能抖動、不能光擾、不能模糊。理想的圖像識別入口應(yīng)該是用戶隨意拿起手機,朝向目標(biāo),即可很快得到識別結(jié)果。

如果能再結(jié)合增強現(xiàn)實技術(shù),就如配圖中所示的那樣,那用戶體驗更將獲得質(zhì)的飛躍。如果這樣的功能和用戶體驗可以在淘寶、微信、新浪微博易信、大眾點評、美圖秀秀等常用客戶端中實現(xiàn),那世界會變成什么樣?便捷?有趣?我想用科幻這個詞來形容更為恰當(dāng)!試想掃一下雜志內(nèi)容、書籍、名片,馬上就能出現(xiàn)視頻、評論、相關(guān)文章、社交信息;掃一下商品包裝就馬上出現(xiàn)一系列使用說明、用戶評論、優(yōu)惠劵、比價信息,甚至可以直接點擊購買;走在商場里掃一下店鋪logo就出現(xiàn)店家代金卷、用戶留言,知道什么東西值得買,什么菜值得吃;看見動人的妹紙,拍一下了解她的興趣愛好,找好話題然后上前勾兌……

還有,如果各個手機攝像頭里也能嵌入這樣的功能,那攝像頭除了拍照,還可以識別、購物、交友,手機本身即可以拋開APP直接變身一個巨量的廣告渠道、電商入口、社交平臺,這可比PK誰薄0.1mm更有意義。再想如果google glass也能具有這樣的功能,那由真實世界到虛擬世界的入口隨時都可呈現(xiàn)在你的眼前,更多的欲望可以被滿足,更多的價值可以被實現(xiàn)。

這一切僅是妄想?從最近一段在業(yè)界引起轟動的技術(shù)測試視頻來看,來自國內(nèi)的一家技術(shù)公司已經(jīng)在圖像識別技術(shù)上已經(jīng)取得了令人振奮的突破,上述的理想,有很多已經(jīng)可以被商業(yè)實現(xiàn)。

內(nèi)行看門道,測試視頻所體現(xiàn)的技術(shù)已經(jīng)成功挑戰(zhàn)了圖像識別領(lǐng)域的許多技術(shù)極限:如簡單特征與復(fù)雜背景、微小目標(biāo)/遠離目標(biāo)、大傾斜、高遮蔽、強反光、逆光、模糊、曲面體特征、褶皺特征等實用條件下的魯棒性、準(zhǔn)確性和快速性。這些實用條件以往都是圖像識別技術(shù)的終極殺手 (包括微信5.0等也不能幸免),但只有在滿足這些條件后,圖像識別技術(shù)才能真正具備成為超級入口的價值。

現(xiàn)在,許多科幻電影的情節(jié)似乎已經(jīng)可以實現(xiàn),移動互聯(lián)網(wǎng)的入口之爭也將由方寸屏幕擴展到大千世界。我們是否應(yīng)該考慮的更多更遠一些?如果這樣的技術(shù)給你來用,你會用來做什么?圖像識別能否像語音識別那樣成為各大移動互聯(lián)網(wǎng)產(chǎn)品和平臺的標(biāo)配?或許,大家可以開始考慮和布局新的商業(yè)模式了。

    相關(guān)評論

    閱讀本文后您有什么感想? 已有人給出評價!

    • 8 喜歡喜歡
    • 3 頂
    • 1 難過難過
    • 5 囧
    • 3 圍觀圍觀
    • 2 無聊無聊

    熱門評論

    最新評論

    發(fā)表評論 查看所有評論(0)

    昵稱:
    表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
    字?jǐn)?shù): 0/500 (您的評論需要經(jīng)過審核才能顯示)