一篇網文“美軍專家表示VR可能永遠不會成功”在網上流傳,該文所講內容作者個人深有感觸。一些業內資深投資人希望我寫篇文章分析一下,對當下VR熱的確需要從真正專業的角度給些建議,遂有此文。
每過一段時間,投資界和産業界都會炒作一個主題,不過相當多的主題最後都不太成功,或者不象最初想象得那麽成功。對于創新要容許一定的失敗率,但有些創新是有規律可尋的,在一開始其實就可以評估到其成功的程度會有多大。前幾年3D也曾如今天的VR一樣熱炒,3D電視甚至已經在很多電視網上進行試播,但很快就不了了之,僅在電影領域獲得一定的成功應用。我很早就不太看好3D視頻技術,這並非簡單的直覺,因作者本人在北郵研究生期間學得就是圖像和視頻專業,並且前後從事了至少10多年視頻相關産品技術和市場,我公司也剛剛投資了一家硅谷的VR創新公司Videostich,因此對該領域技術深有了解。
音視頻工業應用的核心基礎是對人感覺生理測量
絕大多數人往往只是從音視頻信號處理角度看問題,因此僅憑相關技術進步就想去得出市場應用的結論,其實這是很不專業的。音視頻技術是不是能真正在市場上獲得應用,其真正的核心基礎是對人感覺生理的測量。最初電話信號帶寬設定爲3.4KHz,電視信號的幀率標准設定爲24Hz,彩色電視信號采用紅綠藍三基色……所有這些全都是以對人感覺生理特性進行大量的測量爲基礎的。因此,我在當年學習圖像和視頻處理時,爲了更好理解人眼的生理特性,專門閱讀了很多眼科專業和視覺生理學的專著。其實一般電視和視頻處理專業的專著裏,也都有部分章節專門講人眼的視覺生理特性,只是相對簡單些而已。
現在我就來用盡可能通俗的語言告訴網友,爲什麽3D技術很難普遍成功,並且爲什麽長期看2D視頻或圖像不會太疲勞,而看3D視頻和圖像時間稍長就會很不舒服。
如果把人眼與攝像機簡單進行比較,就可以較容易理解它們之間的一些細微卻至關重要的差別。
先說分辨率。人工生産的攝像機或數碼相機分辨率基本是均勻的,也就是你到整個圖像的任何地方去看,它們的分辨率基本都一樣,無論其具體分辨率數值是多少。但人眼卻不同,在人眼視網膜大至中間位置叫“中央凹”,這部分産生視覺的主要是高分辨率的“視錐細胞”,邊緣部分是低分辨率的“視杆細胞”。我們在視覺注意的目標點上會看得很清楚,而眼光周邊的景物就看不太清楚,主要就是這個原因。這其實也是人們的常識就可理解的。在中央凹大約偏下的中心位置,有一個視覺神經集中的點,在這個點上因爲沒有視覺細胞,反而看不見了。這個點叫“盲點”,我們一般是注意不到的,但如果采用一定的方法,可以測到這個盲點,在這裏就不詳述了。
再說下聚焦的問題。相機聚焦一般是通過調節鏡頭距離來實現,因爲相機的鏡頭一般是固體,焦距是固定的。而人眼卻不是這樣,人的眼球是一個形狀可變的液態晶體,它可通過眼部肌肉作用改變眼球形狀來調節焦距。這樣,當你注意某個距離的圖像時,眼球就調節成相應的形狀來看清這個距離的圖像,此時,更遠處和更近處的景物就成爲不清晰的虛像了。我們一般以爲立體圖像是通過雙眼成像的像差實現,其實不完全如此,因爲人眼可以通過聚焦看清的景物來判斷距離,因此即使單眼也可以有立體感覺的。這個規律只要每個網友蒙上自己的一只眼睛看看世界就都可以體驗到了。
以上這些其實我們所有人只要注意一下自己的視覺就可以明白了。只要理解了以上人眼視覺的基本特性,我們就可以來理解一些視頻圖像技術市場應用情況了。
爲什麽看2D圖像視頻沒太大問題?
當你看2D的圖像或視頻時,一般被看的視頻或圖像是處于同一“焦平面”內,也就是人眼球一定的形狀所對應位置是清晰距離的垂直平面上。因此,看2D對人眼相對是比較自然的。
爲什麽看3D圖像對人視覺系統很困難?
前面我們明白了,人眼球的形狀只能對應一定距離的清晰圖像。想象一下,如果你想讓眼球同時看清楚5米和15米的景物,結果會是什麽?這要求眼球同時得變成兩種形狀。人眼是做不到的。如果你對人眼提出這種要求,人眼豈能不難受死了。
但是,3D視頻和圖像技術在原理上就沒考慮人眼以上特性會遇到的問題,它僅僅考慮了人的兩個眼球從不同角度去看同一個景物,從而會通過視差來産生遠近距離的判斷。可是,當人在看這種“人造3D”視頻時,眼球的聚焦機制會變得很痛苦,因爲人眼實際接受的人造3D視頻很可能全是從單一的比如說5米距離屏幕上獲得的,但卻要讓人眼的視覺看到15米遠的景物。這會發生什麽情況呢?通過兩個眼球獲得的不同圖像的確産生了15米距離的“假像”,此時眼球會很自然地向15米的距離聚焦,可是實際光線卻只可能是從5米遠的屏幕上傳過來的。當人眼下意識地要去看清15米遠的景物時,其實它必須聚焦到5米遠才能看清。這種混亂在整個看3D的過程中會始終存在。並且人的眼球還會感到很困惑的一件事情是:明明看起來人造3D景物從1米、15米甚至30米遠都有,但竟然全都是清晰的。實際看自然界時,如果15米遠的景物清晰時,1米、30米的景物應該是模糊的才對。當人眼試圖變換著要看不同距離的景物時,本來要改變眼球形狀聚焦到不同距離處,但實際上它必須固定在5米遠才能看清晰。在這些持續的視神經系統內在沖突下,人眼不感到痛苦才怪。
現在人工的3D視頻原理只是建立在雙眼成像,而完全未考慮單眼立體視覺特性。只要3D的技術原理是如此,就必然會存在雙眼立體成像與單眼立體成像之間的沖突問題,都不可能讓人眼真正舒服。這個問題從目前技術來說,別說還根本看不到解決的希望,而且根本就沒人有膽量試圖去解決。
如果是用頭盔裝置來看3D圖像,應該中央部分清楚,圖像邊緣部分模糊才對。但覆蓋了整個人眼視覺的圖像竟然也全都是清晰的。這個問題不僅頭盔式的3D存在,VR也會有這個問題。
以上就是“美軍專家表示VR可能永遠不會成功”一文中所說的即使目前最頂級的8萬美元一套的軍用VR系統看久了也會犯暈的根本原因所在,而且根本就沒人有膽量試圖去解決這個問題。
因此,3D只能在電影等部分場合獲得應用,但卻難以普及到電視和手機等所有屏幕。原因在于:電影屏幕距離很遠,在看3D電影時單眼立體與雙眼立體的沖突會小一些。但在看一些距離很近的景物時,人眼還是會有些壓力。作爲臨時性的體驗尚可接受,不過應明白別指望其體驗會好到哪裏去。尤其當試圖産生距離人很近的景物時,人眼還是會不舒服。只是短時間産生一下沖突刺激一下還可以。
VR爲什麽現在會火?
一旦我們深入理解了人眼的基本生理機理,就知道真正可行的潛在的市場應用在哪裏了。VR之所以在今天被業界爆炒,並不是VR視頻處理技術發生了多大的進步,雖然進步的確存在,主要是智能手機的普及帶來了成本下降的革命性突破。原來VR頭盔必須要自己制作液晶顯示部件,這個部分的成本無論怎麽降都是相當高了。但是,現在液晶顯示部分可以完全去掉,用智能手機替代,VR頭盔本質上只要一個架子和兩個可調節的鏡片就可以了。這樣一個VR頭盔價格即使頂級的品牌産品也可以降到100美元以下,一旦被中國大量山寨廠家做起來伴隨手機免費送都可以了。
在智能手機的普及的同時,4G網絡的普及也帶來了VR視頻傳輸的基礎條件成熟。
以上兩個條件就是VR可以被炒熱的前提。
VR市場化成功的潛在範圍和深度
我體驗過很多VR的産品,坦率地說絕大多數清晰度很低,看起來很難受。也有些産品技術做得不錯。雖然我認爲VR是否可成功長期有疑慮,不過從樂觀角度說它可能會比3D潛在市場應用範圍廣得多。但無論如何,VR不會是一種象2D液晶屏一樣極爲普遍的視頻顯示技術,這涉及到另一個根本性的約束——VR頭盔。VR同樣是通過雙眼成像來産生大場景視頻的,其優點和問題也都在這裏。
首先是頭盔。很簡單,只要是頭上帶上這麽個玩意兒,無論技術怎麽改進,都別指望長時間觀看人會舒服。
另外一個問題是VR的大場景即是它的視覺震撼,同時也是它的問題所在。看到很大的視場會帶來很強的震撼,但它與人眼觀看真實的現實場景時同樣存在必然的差異,這種差異也必然會讓人眼産生疲勞。人在現實中可通過轉動眼球來看聚焦不同方向的景物,但VR只能通過轉動頭盔實現。目前還極少聽到可通過檢測眼球轉動來變換VR視頻場景的技術。
人眼之所以只在中央凹處有極高清晰度,越到周邊越模糊,就是可以用最少的信息量實現有效的視覺。而在VR中整個大場景全是清晰的視頻圖像,這會強迫人眼去關注整個可以覆蓋全部視網膜的圖像,這在帶來震撼感覺的同時也會很容易使人眼疲勞。
因此,VR市場應用範圍只能是一定時間的應用。如看房、看VR短片、飛行和駕駛模擬器、網上VR購物體驗等,別指望它會最終普及到所有視頻應用場合。
作者簡介:
汪濤
"人類第三次科學革命"倡導者,純科學理論體系創始人,曆經30多年研究和實踐形成科學經濟學體系
上海析易船舶技術有限公司聯合創始人、總經理
雲鋁股份(000807)獨立董事
浙江宇視科技 顧問
中央民族大學客座教授
作品:
《科學經濟學原理——看見看不見的手》
《實驗、測量與科學》
《超越戰爭論——戰爭與和平的數學原理》
《即將來臨的糧食世界大戰》
《純電動:一統天下》
《生態社會人口論》
《通播網宣言》
微信公衆號:純科學
新浪微博:汪濤_純科學
購買《科學經濟學》請點擊下面“了解更多”