AI(Artificial Intelligent)人工智能不是新名詞,在ChatGPT誕生之前,許多人都是通過(guò)電影或新聞事件聽(tīng)聞AI,因此不論是2001年的電影“AI人工智能”、2004年的“機(jī)械公敵”,或者是現(xiàn)實(shí)世界中AlphaGo打敗世界棋王成為世界冠軍,AI對(duì)大部分的人來(lái)說(shuō)就是一個(gè)智能型技術(shù)的統(tǒng)稱 ,一個(gè)很厲害的神秘巨星。
2022年底ChatGPT被各界形容為“橫空出世”,所有的網(wǎng)民幾乎都使用了ChatGPT查詢各種數(shù)據(jù)或問(wèn)題,相關(guān)的AI軟件也以驚人的快速演化與增長(zhǎng),發(fā)展速度令人瞠目結(jié)舌。AI此刻正如同唐詩(shī)中所描述的“舊時(shí)王謝堂前燕,飛入尋常百姓家”,由神秘巨星快速下凡成為工作伙伴,由Nice to have到Must to use,如今沒(méi)用過(guò)、不了解AI的人仿佛就要被時(shí)代淘汰。
AI這個(gè)落入凡間的精靈,令人一則以喜、一則以憂。喜的是ChatGPT、Midjourney、Stable Diffusion等AI軟件變成顯學(xué),要寫(xiě)稿的、要寫(xiě)報(bào)告的、要產(chǎn)圖的,一夕之間都有快速產(chǎn)制的工具,再也不怕內(nèi)容制作上缺法想象力或有障礙;憂的是擔(dān)心AI有可能取代大家的工作。大致上來(lái)說(shuō),AI是通過(guò)機(jī)器學(xué)習(xí)(Machine Learning)、深度學(xué)習(xí)(Deep Learning)、影像辨識(shí)(Image recognition)、自然語(yǔ)言處理(Natural Language Processing)等技術(shù),將大量的數(shù)據(jù)進(jìn)行模擬演算與訓(xùn)練,最終可以推演出應(yīng)用模型來(lái)進(jìn)行決策與分析。
但單獨(dú)存在的AI運(yùn)用對(duì)人類的幫助有限,就算產(chǎn)出文字和圖像可以解決一些秘書(shū)或顧問(wèn)的工作,但實(shí)際上還是僅限于片斷的幫助,無(wú)法完整解決問(wèn)題。而上述提到的AI電影“機(jī)械公敵”,就是在描述一個(gè)AI發(fā)達(dá)的世界,機(jī)器人搭配AI,可以變成工作助手、居家照顧員,人類只要下指令就能完成指定工作,這是我們想象中更理想的AI世界。
AI+AR=神隊(duì)友
此種混合式或進(jìn)階的AI世界,可以視AI為大腦,而眼睛就由AR(Augmented Reality)擴(kuò)增實(shí)境技術(shù)來(lái)扮演。AI和AR是將現(xiàn)實(shí)世界與數(shù)字化、網(wǎng)絡(luò)化整合的一組神隊(duì)友,因?yàn)锳I可以通過(guò)深度學(xué)習(xí)的類神經(jīng)網(wǎng)絡(luò)取代傳統(tǒng)AR電腦視覺(jué)做法,讓AR判讀物理世界的信息更加準(zhǔn)確;AR也可以通過(guò)AI收集更多數(shù)據(jù)強(qiáng)化辨識(shí)演算法,AI再通過(guò)鏡頭不斷偵測(cè)信息強(qiáng)化演算訓(xùn)練;AI也讓視覺(jué)場(chǎng)景加入添加物件檢測(cè)、文本分析、場(chǎng)景標(biāo)注等新功能,進(jìn)一步強(qiáng)化AR體驗(yàn)。
AR結(jié)合AI可謂真正達(dá)成一種數(shù)字化且無(wú)所不在的媒體,AR軟件通過(guò)鏡頭和傳感器辨識(shí)與判讀真實(shí)世界環(huán)境的相關(guān)信息,使用者從而可以用互動(dòng)模式,將虛擬物件或虛擬信息與真實(shí)物理世界相結(jié)合,達(dá)成人機(jī)交互,輔助行為模式。目前已知AI結(jié)合AR神隊(duì)友的產(chǎn)業(yè)應(yīng)用情境將輔助各產(chǎn)業(yè)達(dá)到導(dǎo)覽導(dǎo)購(gòu)、強(qiáng)化訓(xùn)練、節(jié)省人力、提升業(yè)績(jī)等目標(biāo)。
AR結(jié)合AI的產(chǎn)業(yè)應(yīng)用場(chǎng)景與商機(jī)
1. 未來(lái)賣(mài)場(chǎng)與隨看隨買(mǎi)
“虛實(shí)融合的零售賣(mài)場(chǎng)”一直都是被大眾所期待的零售最后一里路,雖然電商被視為是零售商場(chǎng)的一大威脅,但在疫情后零售賣(mài)場(chǎng)因?yàn)橄M(fèi)者體驗(yàn)、社交話題、物流成本高等多重因素,反而需求提高,甚至有線上數(shù)字店走向?qū)嶓w的趨勢(shì),另一層面在元宇宙科技的導(dǎo)入下,線上與線下的整合更是大勢(shì)所趨。零售場(chǎng)域在AI的趨勢(shì)應(yīng)用下,未來(lái)賣(mài)場(chǎng)主要為兩大應(yīng)用方向。
其一為運(yùn)用AI對(duì)象標(biāo)注,其方法是利用機(jī)器學(xué)習(xí)為分類模型,然后再將標(biāo)簽覆蓋在AR環(huán)境中的物理對(duì)象,如賣(mài)場(chǎng)空間或者貨架,消費(fèi)者即可在賣(mài)場(chǎng)中快速尋找到自己想要的商品,并隨時(shí)查找類似品類與了解即時(shí)庫(kù)存。另一應(yīng)用類型為利用類神經(jīng)網(wǎng)絡(luò)(CNN)演算法來(lái)估計(jì)場(chǎng)景中對(duì)象的位置與范圍,檢測(cè)到目標(biāo)對(duì)象后,AR可以將物件疊加在指定目標(biāo)空間中并理解兩者之間的關(guān)聯(lián)與展開(kāi)互動(dòng)。
例如家具產(chǎn)業(yè)就可以應(yīng)用此技術(shù)開(kāi)啟AR鏡頭掃描周圍環(huán)境,量測(cè)出垂直與水平面,并且計(jì)算深度,然后建議適合放置于特定空間的家具,當(dāng)然在工廠也可以通過(guò)即時(shí)標(biāo)注技術(shù)查找零件或顯示操作方式,甚至于進(jìn)行障礙排除等。
2. 未來(lái)工廠與高效訓(xùn)練
多年來(lái)制造業(yè)一直受惠于AI人工智能,大約在80年代起許多工業(yè)場(chǎng)域就開(kāi)始借助AI機(jī)器手臂來(lái)取代一些人力組裝的工作,但機(jī)器人通常和人類一起協(xié)作,執(zhí)行有限任務(wù)范圍,到90年代起,AI更進(jìn)一步取代人力來(lái)辨識(shí)產(chǎn)品的良率并進(jìn)行產(chǎn)能預(yù)測(cè)分析。隨著XR延展實(shí)境技術(shù)成熟,工業(yè)領(lǐng)域中的培訓(xùn)已經(jīng)成為XR運(yùn)用中最受歡迎的應(yīng)用場(chǎng)域。XR提供無(wú)風(fēng)險(xiǎn)、沉浸式、可不斷重復(fù)訓(xùn)練的環(huán)境,以提高各種訓(xùn)練效能。盡管XR本身在訓(xùn)練時(shí)也可以生成不同類型的數(shù)據(jù),但如何解釋與判讀數(shù)據(jù)來(lái)評(píng)估使用者對(duì)操作技能的掌握程度依然是一大挑戰(zhàn)。目前將XR和AI結(jié)合則可以從XR的設(shè)備或體驗(yàn)者端生成數(shù)據(jù)庫(kù),再?gòu)臄?shù)據(jù)庫(kù)中提取和選擇特征值,并由AI演算法來(lái)確定相關(guān)的技能評(píng)估結(jié)果。
另外,在工業(yè)類型的XR操作中,使用者需要解放雙手,因此就會(huì)應(yīng)用到自動(dòng)語(yǔ)音識(shí)別(ASR, Automatic Speed Recognition),自動(dòng)語(yǔ)音辨識(shí)是一種依靠圖像處理來(lái)提取文本的演算法,特定單字觸發(fā)數(shù)據(jù)庫(kù)中標(biāo)記為適合該字詞所描述的圖像,并將圖像投影到AR空間。
在未來(lái)的培訓(xùn)中,XR也將會(huì)廣泛被應(yīng)用在各式訓(xùn)練上,包含醫(yī)療、消防等工作,XR和AI的組合也被用于開(kāi)發(fā)“虛擬使用者”的自然反饋,如在醫(yī)療領(lǐng)域,虛擬病患可在虛擬環(huán)境中與受訓(xùn)醫(yī)生或人員進(jìn)行互動(dòng),虛擬使用者可以通過(guò)互動(dòng)產(chǎn)生各種情境反應(yīng),從而提高受訓(xùn)者的專業(yè)度與特定技能。
3. 未來(lái)城市與貼身秘書(shū)
在2012年推出的Google Glasses示范了未來(lái)城市的情境,人們可通過(guò)智能眼鏡的穿戴,將城市中的各種導(dǎo)覽與體驗(yàn)通過(guò)視覺(jué)體現(xiàn)出來(lái)。后續(xù)Google進(jìn)一步通過(guò)Google Lens的文字辨識(shí)功能,將AI與深度學(xué)習(xí)等文本數(shù)據(jù)進(jìn)行多語(yǔ)言翻譯,最終通過(guò)視覺(jué)追蹤器將翻譯的結(jié)果顯示在AR用戶的目標(biāo)對(duì)象上。
隨著智能眼鏡的逐漸成熟,未來(lái)的智能城市運(yùn)用上,有了AI將不僅僅能提供翻譯服務(wù),戴上AR眼鏡,就好像攜帶了隨身顯示屏幕,最了解你的AI即時(shí)導(dǎo)覽員隨時(shí)提供語(yǔ)音、翻譯、導(dǎo)覽、導(dǎo)航等各式專屬服務(wù)和互動(dòng)游戲,并且用最直覺(jué)的方式將信息顯示出來(lái),就像最貼心的貼身秘書(shū)提供各種便利。
無(wú)論大家擔(dān)不擔(dān)心AI取代人類,都無(wú)法阻止這項(xiàng)科技的進(jìn)步,因此唯有擁抱科技,才能駕馭科技。由以上的情境看來(lái),有了AI與AR這組智能神隊(duì)友,XR元宇宙將會(huì)加速來(lái)臨,腦和眼等細(xì)節(jié)工作將由AI和AR來(lái)輔助,人類可以在工作中當(dāng)專家,下班有貼心秘書(shū)陪你漫游,人類會(huì)有更多時(shí)間用“心”來(lái)享受世界。