AI(Artificial Intelligent)人工智能不是新名詞,在ChatGPT誕生之前,許多人都是通過電影或新聞事件聽聞AI,因此不論是2001年的電影“AI人工智能”、2004年的“機械公敵”,或者是現(xiàn)實世界中AlphaGo打敗世界棋王成為世界冠軍,AI對大部分的人來說就是一個智能型技術(shù)的統(tǒng)稱 ,一個很厲害的神秘巨星。
2022年底ChatGPT被各界形容為“橫空出世”,所有的網(wǎng)民幾乎都使用了ChatGPT查詢各種數(shù)據(jù)或問題,相關(guān)的AI軟件也以驚人的快速演化與增長,發(fā)展速度令人瞠目結(jié)舌。AI此刻正如同唐詩中所描述的“舊時王謝堂前燕,飛入尋常百姓家”,由神秘巨星快速下凡成為工作伙伴,由Nice to have到Must to use,如今沒用過、不了解AI的人仿佛就要被時代淘汰。
AI這個落入凡間的精靈,令人一則以喜、一則以憂。喜的是ChatGPT、Midjourney、Stable Diffusion等AI軟件變成顯學(xué),要寫稿的、要寫報告的、要產(chǎn)圖的,一夕之間都有快速產(chǎn)制的工具,再也不怕內(nèi)容制作上缺法想象力或有障礙;憂的是擔(dān)心AI有可能取代大家的工作。大致上來說,AI是通過機器學(xué)習(xí)(Machine Learning)、深度學(xué)習(xí)(Deep Learning)、影像辨識(Image recognition)、自然語言處理(Natural Language Processing)等技術(shù),將大量的數(shù)據(jù)進行模擬演算與訓(xùn)練,最終可以推演出應(yīng)用模型來進行決策與分析。
但單獨存在的AI運用對人類的幫助有限,就算產(chǎn)出文字和圖像可以解決一些秘書或顧問的工作,但實際上還是僅限于片斷的幫助,無法完整解決問題。而上述提到的AI電影“機械公敵”,就是在描述一個AI發(fā)達的世界,機器人搭配AI,可以變成工作助手、居家照顧員,人類只要下指令就能完成指定工作,這是我們想象中更理想的AI世界。
AI+AR=神隊友
此種混合式或進階的AI世界,可以視AI為大腦,而眼睛就由AR(Augmented Reality)擴增實境技術(shù)來扮演。AI和AR是將現(xiàn)實世界與數(shù)字化、網(wǎng)絡(luò)化整合的一組神隊友,因為AI可以通過深度學(xué)習(xí)的類神經(jīng)網(wǎng)絡(luò)取代傳統(tǒng)AR電腦視覺做法,讓AR判讀物理世界的信息更加準確;AR也可以通過AI收集更多數(shù)據(jù)強化辨識演算法,AI再通過鏡頭不斷偵測信息強化演算訓(xùn)練;AI也讓視覺場景加入添加物件檢測、文本分析、場景標注等新功能,進一步強化AR體驗。
AR結(jié)合AI可謂真正達成一種數(shù)字化且無所不在的媒體,AR軟件通過鏡頭和傳感器辨識與判讀真實世界環(huán)境的相關(guān)信息,使用者從而可以用互動模式,將虛擬物件或虛擬信息與真實物理世界相結(jié)合,達成人機交互,輔助行為模式。目前已知AI結(jié)合AR神隊友的產(chǎn)業(yè)應(yīng)用情境將輔助各產(chǎn)業(yè)達到導(dǎo)覽導(dǎo)購、強化訓(xùn)練、節(jié)省人力、提升業(yè)績等目標。
AR結(jié)合AI的產(chǎn)業(yè)應(yīng)用場景與商機
1. 未來賣場與隨看隨買
“虛實融合的零售賣場”一直都是被大眾所期待的零售最后一里路,雖然電商被視為是零售商場的一大威脅,但在疫情后零售賣場因為消費者體驗、社交話題、物流成本高等多重因素,反而需求提高,甚至有線上數(shù)字店走向?qū)嶓w的趨勢,另一層面在元宇宙科技的導(dǎo)入下,線上與線下的整合更是大勢所趨。零售場域在AI的趨勢應(yīng)用下,未來賣場主要為兩大應(yīng)用方向。
其一為運用AI對象標注,其方法是利用機器學(xué)習(xí)為分類模型,然后再將標簽覆蓋在AR環(huán)境中的物理對象,如賣場空間或者貨架,消費者即可在賣場中快速尋找到自己想要的商品,并隨時查找類似品類與了解即時庫存。另一應(yīng)用類型為利用類神經(jīng)網(wǎng)絡(luò)(CNN)演算法來估計場景中對象的位置與范圍,檢測到目標對象后,AR可以將物件疊加在指定目標空間中并理解兩者之間的關(guān)聯(lián)與展開互動。
例如家具產(chǎn)業(yè)就可以應(yīng)用此技術(shù)開啟AR鏡頭掃描周圍環(huán)境,量測出垂直與水平面,并且計算深度,然后建議適合放置于特定空間的家具,當(dāng)然在工廠也可以通過即時標注技術(shù)查找零件或顯示操作方式,甚至于進行障礙排除等。
2. 未來工廠與高效訓(xùn)練
多年來制造業(yè)一直受惠于AI人工智能,大約在80年代起許多工業(yè)場域就開始借助AI機器手臂來取代一些人力組裝的工作,但機器人通常和人類一起協(xié)作,執(zhí)行有限任務(wù)范圍,到90年代起,AI更進一步取代人力來辨識產(chǎn)品的良率并進行產(chǎn)能預(yù)測分析。隨著XR延展實境技術(shù)成熟,工業(yè)領(lǐng)域中的培訓(xùn)已經(jīng)成為XR運用中最受歡迎的應(yīng)用場域。XR提供無風(fēng)險、沉浸式、可不斷重復(fù)訓(xùn)練的環(huán)境,以提高各種訓(xùn)練效能。盡管XR本身在訓(xùn)練時也可以生成不同類型的數(shù)據(jù),但如何解釋與判讀數(shù)據(jù)來評估使用者對操作技能的掌握程度依然是一大挑戰(zhàn)。目前將XR和AI結(jié)合則可以從XR的設(shè)備或體驗者端生成數(shù)據(jù)庫,再從數(shù)據(jù)庫中提取和選擇特征值,并由AI演算法來確定相關(guān)的技能評估結(jié)果。
另外,在工業(yè)類型的XR操作中,使用者需要解放雙手,因此就會應(yīng)用到自動語音識別(ASR, Automatic Speed Recognition),自動語音辨識是一種依靠圖像處理來提取文本的演算法,特定單字觸發(fā)數(shù)據(jù)庫中標記為適合該字詞所描述的圖像,并將圖像投影到AR空間。
在未來的培訓(xùn)中,XR也將會廣泛被應(yīng)用在各式訓(xùn)練上,包含醫(yī)療、消防等工作,XR和AI的組合也被用于開發(fā)“虛擬使用者”的自然反饋,如在醫(yī)療領(lǐng)域,虛擬病患可在虛擬環(huán)境中與受訓(xùn)醫(yī)生或人員進行互動,虛擬使用者可以通過互動產(chǎn)生各種情境反應(yīng),從而提高受訓(xùn)者的專業(yè)度與特定技能。
3. 未來城市與貼身秘書
在2012年推出的Google Glasses示范了未來城市的情境,人們可通過智能眼鏡的穿戴,將城市中的各種導(dǎo)覽與體驗通過視覺體現(xiàn)出來。后續(xù)Google進一步通過Google Lens的文字辨識功能,將AI與深度學(xué)習(xí)等文本數(shù)據(jù)進行多語言翻譯,最終通過視覺追蹤器將翻譯的結(jié)果顯示在AR用戶的目標對象上。
隨著智能眼鏡的逐漸成熟,未來的智能城市運用上,有了AI將不僅僅能提供翻譯服務(wù),戴上AR眼鏡,就好像攜帶了隨身顯示屏幕,最了解你的AI即時導(dǎo)覽員隨時提供語音、翻譯、導(dǎo)覽、導(dǎo)航等各式專屬服務(wù)和互動游戲,并且用最直覺的方式將信息顯示出來,就像最貼心的貼身秘書提供各種便利。
無論大家擔(dān)不擔(dān)心AI取代人類,都無法阻止這項科技的進步,因此唯有擁抱科技,才能駕馭科技。由以上的情境看來,有了AI與AR這組智能神隊友,XR元宇宙將會加速來臨,腦和眼等細節(jié)工作將由AI和AR來輔助,人類可以在工作中當(dāng)專家,下班有貼心秘書陪你漫游,人類會有更多時間用“心”來享受世界。