ソニーXRや次世代有機EL、そしてプレーヤ終焉論まで~'21年夏の本田・山之内AV対談 - AV Watch
ソニー・ブラビア「XRプロセッサ」は、画作りの新たな潮流を作る?
――上期の最新テレビにおける特徴の1つに、HDMI2.1サポートが挙げられますね。
本田:確かにHDMIのバージョンは気になる人が多いと思う。ただ、HDMI2.1に関しては全ての人にとって重要かと言えばそうではない。というのも、対応するコンテンツには限りがあるから。現時点ではゲーム、主にPlayStation 5がもっとも大きなコンテンツでしょう。映画やドラマ、アニメの視聴が目的なら、HDMI2.1はそれほど重視しなくてもいいと思いますね。
ただ、ゲームの世界は計算能力の向上で、あっという間に高精細、高フレームレートになっていく。最新のコンピュータゲームに興味があるなら、HDMI2.1対応は重要でしょう。将来的には当然必要とされる機能ではありますが、今はまだ「次に買い換えるときには対応しているといいな」という意識でよいと思う。
山之内:いまの時点で「HDMI2.1非対応モデルは購入を見送る」という人はそう多くないと思いますが、2021年モデルでは対応機種が増えています。「対応していれば安心」と考えるなら、選んで購入するのは賢明でしょうね。
HDMI2.1の4K120p入力やVRRなどの機能は現状、ゲームなどのコンテンツに限られる本田:HDMI1.2、1.3、1.4とバージョンによって伝送できる音声フォーマットが大きく異なった場合と違い、2.1はそういった要素はなく、音質面でも特に考える必要はありませんからね。
むしろ、今年前半のビジュアル技術に関するトピックとしては、ソニーがブラビアのXRプロセッサで新しいコンセプトを導入したことと、LGが次世代有機EL「OLED evo」を採用したテレビを投入したことでしょう。
後者は発光素材が変更されていますから、将来的に使いこなせば大きな違いが出てくる。現在はLGのみの採用に止まってますが、当然、今後は他社にも採用進んでいくと考えてよい。ここ数年は熟成が進んでいたOLEDテレビですが、このタイミングで次のステップへと登る、その直前に来たイメージですね。
LGは5月、次世代有機ELパネルを採用した「OLED G1」シリーズを発表した。写真は65型4K有機ELテレビ「OLED 65G1PJA」次世代パネル“LG OLED evo”の最上位4Kテレビ「G1」。壁ピタ設置も
――山之内さんは、XRエンジンに関してどのような感想を持たれましたか。
山之内:ソニーがこれまで目指してきた画質改善技術の延長線上にある技術であり、まったく新しいことをやっているという印象は受けませんでしたね。簡単に言えば、どう見せるかというノウハウをXRによって従来よりも洗練された形で実現することを目指し、動作の精度を高めてきたと理解しています。
注視点に対して精細度や階調表現を最適化して見せていくという手法は、そもそも人が注視する領域をどこまで正しく検出できるかにかかっている。
どこに人間の脳が反応し、どんな情報を重視するかと言うことは、テレビの映像に限らず、自然界、普段の生活はもちろん、美術館にいって絵を見るときでも、ほぼ一定の法則があり、距離や明るさも重要な意味を持ちます。それを実際にルール化し、重点的に信号処理をするという着想はそれなりに理にかなっているし、精度を上げれば一定の効果を上げられる。XRプロセッサを搭載した液晶と有機ELの実機を見て、ある程度の成果を上げていることは確認できました。
認知特性プロセッサー「XR」を搭載した、ソニー・ブラビアの「XRJ-85X95J」ソニー、XRプロセッサで“絵も音も進化”液晶ブラビア「X95/X90J」
山之内:画面が大きくなると、画面のどこを見るかは割とハッキリしてくる。人によっては背景に目が行く人もいるでしょうが、人物なら顔の表情を注視するし、動いているものに敏感に反応します。
ただ、画作りの上で重要視して作り込んでいる部分は作り手によって様々です。たとえば主役じゃ無いけれど、脇役としてとても重要な人物が写り込んでいて、そこに重要な情報が込められているような場合もある。当然ながら、そうした部分まで検知できるわけではないでしょう。ある程度、普遍的な注視ポイントを分析する手法としては面白い試みだと思いますね。
認知特性プロセッサー「XR」本田:XRエンジンは積極的に画を変える。そこが良いところでもある一方、AVファンにとっては疑問点かもしれないので、まずは今のトレンドについて話しておきたいです。
ディスプレイにとってプレミアムな映像の印象を詳らかにする性能は最も重視されてきました。いわゆる「ディレクターズインテンション」というもので、監督が意図した通りの印象を映像から感じ取れるかどうか、ということです。最近でもNetflixモードやIMAXモードなどもあるし、THXモードなどもある。この点はいまも昔も変わっていません。映画モードなどは基本的にそうした考えに基づいています。
でも、テレビで表示する映像は、必ずしも監督が全ての映像演出を事細かに考えて作られたものばかりではありませんよね。ニュースもバラエティも舞台も音楽コンサートもあるし、スポーツ中継もあれば、YouTubeなどのネット投稿系コンテンツもある。ドキュメンタリーや自然を映したものは、ただあるがままの自然を感じたいはず。こうしたディレクターズインテンションが強くないコンテンツも、そのままマスターモニターライクに表示するのが良いというのが、これまでの考え方でした。
ところが技術的に進歩した現代では、別のアプローチを試すための新しいツールが生まれました。それがAI的なアプローチで映像を処理する手法です。カメラを通じて捉え、記録している映像は、本当の実態、実物を見た時とは異なります。記録、配信、表示の段階で妥協を強いられるからです。そこで肉眼で見た風景や質感との差分、あるいは露出などに多少問題があった場合の補正などをニューラルネットワーク処理で行ない、現実の映像に近づけことが注目されるようになった。
認知特性プロセッサー「XR」の処理イメージ。XRプロセッサでは、ひとの注視点に応じて最適な画質処理を行なう以前から各社は、より積極的に美しく見せよう、記憶の中の自然な風景に近づけようという取り組みをしてきましたが、近年はその手法が変化してきています。XRエンジンはその文脈の中で生まれてきたもので“認知的”な高画質化処理をするものです。
“認知的”というのはIBMが言い始めた言葉で、コンピュータは認知はできないものの“あたかも認知しているかのような動き”は可能なので、認知的に被写体や背景、素材などを判別し、適切な処理を行ないます。
ある意味、ディレクターズインテンションとは真逆の方向なのですが、どちらかが間違いではなく両方とも必要。今のところXRエンジンは、最も積極的にAI的アプローチで映像を処理していると思いますね。
さきほど山之内さんが話していたように、70型、80型になると、映像の視野が大きくなります。画面全体をボーッとみているのではなく、画面の中の特定の場所を注視していることが多くなる。昔とは映像の作り方も変化してきて、人物も一人だけをバストアップで抜くショットが減り、複数の人が同時に映るようなフレーミングするシーンが増えています。つまり引きのシーンが多いから、大きな画角の中で”視聴者はここを観ているはずだ”と予測し、識別した被写体に対して徹底的にリアリティを追求していく。そこがXRプロセッサのポイントでしょう。従来からの延長線にある技術ではありますが、より細かく、掘り下げていると感じますね。
XRプロセッサは、画面を数百のゾーンに分割した上、ゾーン内の個々のオブジェクトに対し、焦点や色、コントラストなどを詳細に認識。ひとの脳が機能するのと同じように、1秒で画像を構成する約数十万の異なる要素を相互分析することができる、とするでは他社はどうなのか? ということを見ていくと、他社も同じようなことをしているのですが、アプローチが違う感じです。あまりオブジェクトごとの認知をするというよりは、シーンを判別して、それをシーン毎に最適化しようとするアプローチ。面で画一的に処理するのではなく、これはこれ、これはこれ、というように個別にやっていくイメージでしょうか。
XRプロセッサに最も近い処理をしているのは、おそらくスマートフォンのカメラでしょう。
たとえばモデルがいて、逆光壁の建物があって、さらに空があってみたいな構図を普通に撮影すると、空が白く飛んで、壁は少しシャドウが強くなってしまう。ところがiPhone12シリーズで撮影すると、顔にも日陰の建物にも、青い空にも適切なホワイトバランスが適用され、露出もそれぞれの被写体ごとに適正になります。普通のカメラではあり得ないトーンマッピングですが、これは被写体を領域毎に切り抜いて、認識して映像処理を行なっているから。そのためにAI的な処理アプローチを行なっているのですが、同様のことを映像を表示する際、リアルタイムに行なおうとしています。
XRプロセッサの最適処理により、自然で現実世界のような映像を作り出す――私も視聴しましたが、XRプロセッサの効果が強過ぎたためか、本来あるはずの奥行き感が損なわれ、やや平面的に見える場面もありました。
本田:“映像の品位”と”映像の質”は別々に捉えた方がいいでしょう。元々情報量が少なかったり、ノイズが一定以上ある時に、どの程度まで補正するのが観やすいかということ。もともとノイズや歪みが多い地デジなどの場合は、やり過ぎと感じる場合もあるでしょう。でも、質が高い映像に対して同じように作用するかといえばそんなことはない。
つまり映像の品位に大きな影響は与えず、質を調整するのであれば、ギリギリまでやった方がいいと思います。同じようなことはレグザもやっているし、各社、程度こそは異なるが、品位が低い映像に対しては可能な限り積極的に介入して、観やすい映像にしようとしていますよ。
クラウドAI高画質テクノロジーを搭載する、4K有機ELレグザ「X9400Sシリーズ」レグザ、“自然で美しい人肌”のフラッグシップ4K有機EL「X9400S」
本田:それどころか、品位が上がるかのような振る舞いを見せるときがある。たとえば、世界中の風景を高精細に見せるといったよくあるデモ映像では、奥から手前にかけてのボケ方、つまり被写界深度の変化がとても自然に見えました。これが奥行き感をもたらして、自然な立体感を演出していると感じます。
山之内:私が見た映像ではそれほど違和感が大きいと感じたところはなかったですね。UHD BDで見たヴェルディの「イル・トロヴァトーレ」は、引いたカメラで舞台の全景をとらえる場面と、もう少し寄ってフルショットで撮影した画面が中心。その両者を見比べるなかで、人物の表情や背景の明るさの変化を違和感なく、自然な範囲で描き出していました。人物の表情をていねいに再現しつつ、リアルに作り込まれた舞台装置の質感もそれらしく再現していると感じました。
ソニー・ブラビアの4K液晶「XRJ-85X95J」(写真左)、4K有機EL「XRJ-83A90J」(右)“脳のように処理する”ブラビアXR有機EL。PS5の4K120p対応