圖片來源:視覺中國
钛媒體注:本文來源于微信公衆號硅谷密探(guigudiyixian),钛媒體獲授權轉載。
自認爲英語還可以的小探,最怕和別人說話時,別人說了一句怎麽也聽不懂的英文。
一般來講,第一次沒聽懂,你大可以放心大膽地請人家再說一遍。
第二遍如果還沒聽懂,小探覺得就有必要加上兩句 “不好意思,剛才沒聽見” 之類的客套話,請人家再重複一遍。
如果第三次還沒聽懂(而且這時對方的不耐煩一般已經很難掩飾了),小探只好禮貌微笑+說一句 “yeah, right?”,然後默默祈禱人家剛才說的那句話不是一個問題。
這種略尴尬的情形,相信不少人都遇到過。每當這時小探就忍不住想:要是所有人講的話都能和電影裏一樣配上字幕就好了!
還別說,很快,微軟就會讓這個想法變成現實…
Skype 和 PowerPoint 幻燈片將有實時字幕
相信大家對視頻聊天軟件 Skype 並不陌生。本周微軟宣布,以後我們再用 Skype 的時候,就能有實時字幕功能了!
也就是說,不論視頻還是語音,你在和對方聊天的時候,不論是對方說的話、還是你說的話,Skype 都能同時把它變成字幕,呈現在屏幕下方 —— 就像我們看電影、看劇底下的那行字一樣,只不過它們不是預先寫好的台詞,而是你在那時那刻說的話。
圖自 Microsoft,版權屬于原作者
使用 Skype 時,點擊 “更多(+)” 按鈕,然後選擇 “打開字幕”,就可以使用這項功能啦!
圖自 Microsoft,版權屬于原作者
如果嫌麻煩,也可以直接調成默認有字幕的設置:點擊你的頭像,進入 “設置” 欄,然後進入 “呼叫”、再點 “呼叫字幕” 的 “顯示字幕”,就可以以後每次通話默認顯示字幕了。
圖自 Microsoft,版權屬于原作者
“即時翻譯” 這個功能打開後,對方說的話的字幕就會像電影字幕一樣自動滾動 —— 但字幕過去了就過去了,目前用戶還不能往前翻、查看之前的對話。
不過微軟說了,以後還會開發其它讓大家看字幕的方式,比如側窗滾動字幕,這樣如果對方剛才說的東西你沒聽清,還可以往上滑動字幕,找回去。
微軟還說,這個新功能不僅能夠快速、連續地給對話配上字幕,而且隨著對你說的話了解越來越多,AI 自己能通過研究上下文做 “閱讀理解”,讓自己越來越聰明、把字幕轉寫得越來越准確。
雖然目前這個新功能只支持英語,但很快 Skype 將支持超過 20 種語言和方言翻譯的功能。到時,Skype 不僅有即時字幕,還能用機器做到 “同聲傳譯”。
看到這個新聞,小探的第一反應是:爽!再也不怕對方說話不清楚、口音重之類的問題,簡直是居家旅行、學習外語、跨國交友的必備良品。
不過,微軟發布這個新功能的本意,其實是想幫助耳聾或聽障人士,讓他們可以在用 Skype 時,通過閱讀實時翻譯的對方說的話,來參與到對話裏。
這就是爲什麽微軟特意選擇在本周一發布這個新功能:12 月 3 號是聯合國國際殘疾人日。微軟選擇在這一天給 Skype 加上實時字幕,就是希望通過這個小功能,讓聽障人士的生活簡單一點點。
除了 Skype,微軟還計劃把我們最熟悉不過的 “PPT” PowerPoint,也加上實時字幕。不僅如此,PowerPoint 也會有即時翻譯功能,甚至還能把字幕發到聽衆的手機上。
想象一下:假設一個有口音的人在以英文演講,但你聽不太懂,因爲他的口音實在是太嚴重了(比如俄羅斯、新加坡或巴西口音)。這時,你可以看大屏幕上的英文字幕,或者也可以讓 PowerPoint 直接把英文翻譯成中文,發到你的手機或電腦上。
哪裏聽不懂點哪裏,媽媽再也不怕我視頻開會時聽不懂印度老板的話了。
聽著不錯吧?不過微軟說,這個功能正式發布,還需要等到明年年初。PowerPoint 將提供 12 種語言的實時字幕,還能把原語言翻譯成 60 多種語言。
小探認爲,PowerPoint 背後 AI 的語音識別技術,有個其他語音識別技術沒有的優勢:它不僅需要分辨出你說的話,還需要把你說的話,與幻燈片上的詞彙聯系起來,這樣可以更准確地識別演講中提到的專有名稱和特定術語。
和 PowerPoint 頗爲相似的 Google Slides 也推出了同樣的功能,但相比之下,PowerPoint 的功能更全面些:
Google slides 的實時字幕功能 / 版權屬于 Google
不論 PowerPoint 還是 Skype,微軟給這兩個産品新添加的功能,都是用 AI 把正在發生的談話實時以文本的形式呈現出來,讓 AI 變成我們的速記員和同聲傳譯。
除了方便不同語言的人之間的交流,微軟此舉更是意在幫助聽障人士。而微軟對殘疾人群體的關注,早已不是一兩天。
微軟:用 AI 改善殘疾人的生活
全球殘疾人人數超過 10 億,很多時候,這個群體並不能像其他人一樣享受科技帶來的便利 —— 在這 10 億人中,只有約 10% 的殘疾人用得上輔助工具(比如助聽設備、義肢等)。
殘疾會讓找工作變得格外艱難。根據美國人口普查局的統計,在失聰及聽障人群裏,只有 52% 的人有工作。無法保證工作,自然會導致生活水平下降,對殘疾人來說,無疑雪上加霜。
一直以來,微軟就想通過 AI 讓殘疾人能更好地參與到工作環境裏,而 PowerPoint 和 Skype 的實時字幕只是微軟諸多動作中的一兩種。要知道,在過去三年裏,微軟給 Office 365 的各個産品陸陸續續加了 30 多個方便殘疾人用戶的功能。
而幫助殘疾人更適應工作場所,其實只是微軟 “用 AI 改善殘疾人生活質量” 這個宏大計劃下的一小部分。
今年 5 月 7 號,微軟在其名爲 “Build” 的年度開發者大會上宣布,將開展一個名爲 “AI for Accessibility”(“用人工智能,讓生活無障礙”)的人工智能項目。
微軟計劃在未來五年裏,專門拿出 2500 萬美元,幫助那些能改善殘疾人生活、工作、和與人交流相關的 AI 産品的開發。微軟認爲,語言不通、或者有某種身體殘疾,都不應該成爲交流的障礙。微軟之所以如此關注這一領域,不知道和微軟 CEO 的兒子身患殘疾是否有關。
這個計劃將通過三種方式來實現這一點。
首先,微軟將大學、科研機構、開發者,任何提出幫助殘疾人生活更便利的 AI 解決方案的團隊提供種子技術授權,優先使用 AI 方法,幫助更多殘疾人士找到工作、降低生活裏的不便(比如我們上文提到的無法用 Skype、無法聽別人的演講)。
然後,微軟從這些項目裏選出最有可能成功的項目,進行更大規模的技術投資,同時微軟也會帶著自己的資源,比如讓微軟的 AI 專家、合作夥伴參與進來。
接下來,在服務中注入人工智能和包容性設計時,微軟也會將這些 AI 創新融入到平台級的服務中,讓盡可能多的人能夠從中獲益。
其實,微軟在殘疾人工具研發這件事情上,一直就沒少花心思。微軟在這方面比較有名的一個産品叫 Seeing AI —— 這也是微軟十多年計算機視覺的研究成果。
Seeing AI 是微軟 2017 年推出的一款 “利用電腦視覺,給盲人描述、解釋世界長什麽樣” 的應用,微軟自己管這個應用叫 “爲盲人群體服務的有聲相機”(Talking camera for the Blind)。這款應用已經在蘋果商店獲得了超過四星的評分,頗受好評。可惜的是,Seeing AI 目前還只支持英文版。
比如說,視障人士打開這款應用,對著信封,Seeing AI 就能把信封上的信息讀出來:
再比如說,Seeing AI 可以告訴用戶它都看到了什麽。 如下圖所示,它看到了 “一把黑色的吉他”,和 “一只手拿著一塊表”。
哦對了,小探在寫這篇文章查資料時看到,有視障用戶在用了 Seeing AI 的産品後,可以幫年幼的孩子檢查作業了。
微軟高級産品營銷經理 Malavika Rewari 接受外媒采訪時表示,微軟的 “無障礙小組” 裏,約 90% 的員工都有某種殘疾。
Ann 是微軟 Seeing AI 應用研發小組的一名成員,同時也是一名盲人。
而他們爲殘疾人開發出來的像 Seeing AI 之類的産品,無疑使殘疾人離獨立、便利、更有尊嚴的生活又近了一步。
用科技改善殘疾人的生活
在提高殘疾人的生活質量這件事上,微軟不是唯一一家。
民宿巨頭 Airbnb 就是其中之一。以前,用戶在 Airbnb 平台搜索房屋時,除了 “價格”、“位置” 等搜索條件,在 “無障礙” 這塊,只有 “方便輪椅進出” 這一個相對比較粗糙的選項。
今年三月,Airbnb 新添加了 21 個更細致的 “無障礙” 篩選條件,比如 “是否有無障礙停車位”、“無障礙淋浴” 等條件,讓輪椅使用者出行更方便。
谷歌地圖相信大家也不陌生。今年,谷歌給用戶在選擇路線的時候,新添加了 “輪椅可行” 的選項。這樣,輪椅使用者就可以避開沒有輪椅配套設施的地方。目前只有紐約、倫敦、東京、波士頓、墨西哥城和悉尼的谷歌地圖配備了這個新功能,不過谷歌計劃把它推廣到更多城市。
當然,不論是 Seeing AI 還是谷歌的地圖,在用戶體驗上還有很多需要改善的地方,但這種趨勢讓人感到非常欣慰。
小探以前有種 “發達國家的殘疾人更多” 的錯覺,因爲在街上總能看到殘疾人。相比之下,國內街上殘疾人出現的比率似乎低了不少。其實,這不是因爲中國的殘疾人人口比例更低 —— 據統計,2017年中國各類殘疾人總數爲8500萬人,也有統計認爲人數接近一億,是世界上殘疾人口最多的國家。之所以大街小巷上不怎麽看得到殘疾人,是因爲我們的無障礙設施還做得很不到位。
不論出于溫情,還是龐大的殘疾人群體背後的巨大市場,硅谷的巨頭們紛紛開始關注無障礙領域裏的機會。希望不遠的將來,這類新技術能幫助殘疾人們獲得更便利的生活。
更多精彩內容,關注钛媒體微信號(ID:taimeiti),或者下載钛媒體App