22.5克的小黑盒,讓視障者嚐到前所未有的自由和獨立

圖片來源:OrCam’s Twitter

你問,AI應用可以如何改變世界?OrCam會說,讓全球3億的視障人口,以及更多患有嚴重閱讀障礙和閱讀疲勞的人口擁有新生活。

Amnon Shashua是全球知名的電腦視覺專家,共同創辦了全球最大的無人車駕駛輔助系統公司Mobileye, 2017年被英特爾以153億美元(約新台幣4,530億元)收購,現任英特爾資深副總裁。

時間拉回到1993年麻省理工學院的博士畢業典禮上。「我太太的阿姨莉莉.紐曼(Lily Newman) 一輩子住在紐約市。她因黃斑部病變導致視網膜破裂。典禮結束後,她告訴我,身為一個科學家,你得想想辦法解決我的問題,」Shashua回憶 。

「我向她解釋我這個doctor(博士)不是你想的那種救人的doctor(醫生),我寫的是方程式、軟體和代數,但這件事一直在我腦中揮之不去。」2010年,他和Mobileye的老戰友Ziv Aviram再創OrCam,透過 AI 應用,讓盲人聽見世界。Shashua道:

「或許我們無法讓殘疾消失,但我們能善用電腦科學彌補視力的喪失」

這款名為「我的眼睛 (MyEye) 」的AI應用,是個和手指差不多大,可吸附在眼鏡架上的黑盒,內建攝影機、麥克風和骨傳導喇叭,視障者只要用手指輕點一篇報導、一份菜單、一方路牌,黑盒裡的鏡頭便會掃描、再用深度學習(Deep Learning) 來解析文字,在他耳邊輕聲朗讀。

宛如一盞黑暗中的探照燈,鏡頭持續掃描前方的視野,搜尋熟悉的模式,當鏡頭辨識出使用者的手勢,即拍下所指的文字或圖像並比對已知內容。從早上幫他辨識衣服的顏色,出了門識別紅綠燈號誌,街道名稱,商家店名,公車號碼,錢幣找零,閱讀書報,100張熟人臉孔,上百萬種商品,並能個人化儲存150件事物。

貼心的「MyEye」,會在書報拿反時,提醒視障者轉正;閱讀外語時,自動幫忙翻譯;無法辨識來者時,給予提示,例如「有位年輕女士正站在你的面前」。

2019年,「我的眼睛(MyEye2)」被選為美國《時代雜誌》百大最佳發明。在獲獎感言裡,繼人類將AI變成我們的眼睛、耳朵和大腦後,Shashua提出其開發初衷是作為視障者的「AI伴侶 (AI as a companion) 」。

靠著自然語言處理的加持,OrCam在今年初的全球消費性電子展上推出個人助理的新功能,進一步推進其理想。與其從頭到尾地讀稿,視障者可聲控鎖定只讀報紙上的標題,搜尋特定單詞,帳單末的應繳金額,或菜單上的前菜選項。

決定產品開發藍圖的,是開發之初針對數百位視障者的需求訪談。

出乎意料的,高達90%的人希望能閱讀,原以為的辨識障礙物反而不是關鍵。百思不得其解的Aviram決定做個小實驗:暫停閱讀一天。結果,不到一小時他就喊停,「才過5分鐘,你就了解我們的世界是由多少文字組成的。」

此外,有視障者希望能識別顏色,解決穿衣搭配的困擾;還有人「無法認得一米外的妻子」,為此加入了自動辨識人臉的功能。他們也開發一個同時感知使用者和環境的用戶介面,讓使用者用「手勢」來告訴機器重點在哪裡。因此,機器知道要聚焦在公車站牌上,而非後方的路牌或廣告看板。

儘管AI無法讓他們重拾光明,卻能直接地幫助他們在這個並非為他們設計的世界裡找到方向,安身立命,體驗逛逛街、刷手機、上超市的日常生活。然而,台幣15萬的高額售價是目前最大的推廣障礙,OrCam希望透過政府補助、保險公司給付,讓更多人能受惠。

(感謝本文協同研究者王茜穎)

圖片來源:若水國際

延伸閱讀
用AI改變教學現場,創造下一代嶄新的學習體驗
用VR訓練全球4,700店員工 全球零售巨人Walmart瞄準這3大領域
世界第一個,在雲端科技為身障者打造全新工作