大きなインタビュー:Intel Alchemist GPUとXess UpscalingがPCゲームをどのように変えるか

大きなインタビュー:Intel Alchemist GPUとXess UpscalingがPCゲームをどのように変えるか

先週、インテルはついにカードを提示した。 2021 年の Architecture Day では、同社はラップトップからデータセンターに至るまで、CPU やグラフィックスにまたがる真にエキサイティングな新製品を多数発表しました。同社は、数年間でコンピューティング パフォーマンスを 1000 倍に大幅に高速化することを目指しています。これは一見不可能な仕事のように思えますが、インテルは最先端の CPU、GPU、統合テクノロジーを活用してそれを達成したいと考えています。戦略の中核は、競争力のあるグラフィックス パフォーマンスを提供することにあります。そこで、Intel の新しいディスクリート GPU ラインが登場します。そして、それらは非常に優れています。
コードネーム「アルケミスト」の新しい GPU は、Intel の既存のグラフィックス技術 (Tiger Lake に統合された形で、DG1 グラフィックス カードによる限定リリースで見られる) を採用し、それをあらゆる方向に拡張することを目指しています。より多くの実行ユニット (DG1 では 96、DG2 では最大 512)、より多くの電力、より多くのメモリ帯域幅に加え、TSMC の新しい 6nm 製造プロセスの速度と効率の利点をすべて備えています。
YouTubeビデオのカバー画像
しかし、それ以上に新機能もあります。実際、Alchemist GPU のブロック レイアウトを見ると、AMD よりも Nvidia 製品にはるかに近い哲学を持っているように見えます。 Team Red がハードウェア アクセラレーション RT および機械学習機能よりもラスタライゼーション パフォーマンスとメモリ帯域幅の最適化に焦点を当てていたのに対し、Intel は、これらの次世代機能専用に大幅に多くのシリコンを使用し、GeForce ラインにはるかに近いバランスを提供しています。
しかし、これらの機能は当然使用する必要があり、それがインテルによる XeSS の公開が非常に重要である理由です。 Architecture Day (およびこのインタビュー) から収集したスライドと情報に基づくと、Intel は独自の DLSS 2.x テクノロジを使用して Nvidia と同じアプローチに従っているようです。ただし、その導入戦略は大きく異なります。Intel は機械学習ベースのスーパー サンプリングを標準化したいと考えており、Nvidia が DLSS で行うように独自のものにすることに興味はありません。 XeSS はさまざまなベンダーのさまざまな GPU に対応します。これはまさに、このテクノロジーが PC ゲームの一部となるようにするための正しい戦略です。
そして、それらすべてがこのインタビューの基礎となっており、わかりやすく編集されています。このインタビューでは、私と #FriendAndColleague の Alex Battaglia が、Intel 副社長兼グラフィックス ソフトウェア責任者の Lisa Pearce と、エンジニアリングフェローの Tom Petersen に、Alchemist に何を期待するか、どれほどオープンでオープンかについて質問しました。標準化された XeSS が実際にどのようなものになるのか、同社がソフトウェア スタックで行ってきた作業、およびインテルの観点からグラフィックスの将来がどのように見えるかがわかります。ちなみに、私は野球帽をかぶったことがありません…

Digital Foundry: 明らかに、専用グラフィック分野への移行は、Intel にとって非常に興味深い展開です。開発には長い時間がかかりましたが、ここへの移行を秘密にしていませんでしたが、全体的な戦略は何ですか?なぜ専用のグラフィックススペースに参入するのでしょうか?
リサ・ピアース: 見てみると、信じられないほどの市場ですね。私たちの多くは、長い間統合グラフィックスに取り組んできました。 Intel は 20 年にわたってグラフィックス ビジネスに携わっており、低消費電力でフォーム ファクターに制約のあるソリューションを提供してきました。市場はディスクリート グラフィックスのより多くのオプションを求めていると思います。ですから、私たちはそれに取り組むことにとても興奮しています。これは間違いなく Xe に大きな目標を持ったものであり、クライアントだけでなくデータセンターにとってもスケーラブルなアーキテクチャです。今は非常に興味深い時期であり、業界は新たなプレイヤーの登場を期待していると思います。
デジタルファウンドリ:その通りです。市場のニーズという点では収束してきていますね。明らかに、Nvidia は AI、レイ トレーシングの点で大きな影響を与え、これらすべてがゲーム市場に収束する可能性があります。そして、Intel もこの争いに参加しているのを見るのは素晴らしいことです。そこで、Alchemist GPU が明らかになりました。そして、あなたが私に望んでいない質問をするつもりですが、市場全体の観点から、それがどこに着地すると予想しますか?この GPU はゲーマーに何をもたらすのでしょうか?つまり、これは「パフォーマンス」という言葉には関係なく、パフォーマンスに関する私の質問です。
Tom Petersen: そうですね、もちろん、リチャード、私たちはパフォーマンスについて話すつもりはないので、あなたの質問に直接答えることはできません。しかし、Alchemist とは何かということを理解していただくと、まずこれがフル機能のゲーム用 GPU であると言えるでしょう。あなたの心の中には何の疑問もありません。そして、これはエントリーレベルの GPU ではなく、間違いなく競争力のある GPU です。次世代ゲームに必要な機能をすべて備えています。ですから、パフォーマンスについては話さなくても、とても興奮しています。
デジタルファウンドリ:素晴らしいですね。そして、TSMC 6nmで最初に市場に投入されるようです – 興味深い選択です。すでに市場に出ているものや、2022 年第 1 四半期に直面するものに対して、このプロセスがもたらす利点を実際に定量化できますか?
Tom Petersen: そうですね、やはり、それはパフォーマンスに少し近づきすぎています。しかし、明らかに、他のチップに先駆けて次世代プロセスに参加していることは、当社に利点をもたらします。そして、技術ロードマップのような予測を提供できる専門家は世の中にたくさんいますが、この専門家は違います。
YouTubeビデオのカバー画像
Digital Foundry: アーキテクチャを見ると、もちろんラスタライゼーションに重点が置かれていることがわかりますが、レイ トレーシングと機械学習が最重要視されており、これは AMD や RDNA 2 で見られたものとは一種異なる戦略です。これは Nvidia と同様で、機械学習と専用のレイ トレーシング コアに焦点を当て、レイ トラバーサルなどを高速化します。 Intel はそのようなアプローチをとっているのですが、なぜでしょうか?
トム・ピーターセン: そうですね、私にとって、それはテクノロジーが自然に進化しているだけだと思います。 AI が文字通り世界中のあらゆる垂直アプリケーションに適用されていると考えれば、ゲームに大きな影響を与えることは間違いありません。実際、AI スタイルの計算を従来のレンダリングに融合することで、従来の結果よりも優れた結果を得ることができます。そして、私たちはまだそのテクノロジーの初期段階にいると思います。現在、主にポストレンダリングされたピクセルに取り組んでいます。しかし明らかに、AI がゲームを変えるのはそこだけではありません。ですから、それは自然な進化だと思います。
繰り返しになりますが、レイ トレーシングについて考えると、従来のレンダリング技術よりも優れた結果が得られます。どこでも機能するわけではなく、明らかにパフォーマンスとのトレードオフが存在します。しかし、これはゲーマーの生活を向上させるための素晴らしいテクニックです。したがって、こうした傾向は今後も加速していくだろうと思います。そして、実際にある程度の調整が行われていることは素晴らしいことだと思います。なぜなら、Intel や Nvidia、さらには AMD などのハードウェア ベンダー間の調整により、ISV は安定した機能プラットフォームを確認できるからです。そしてそれがゲーム市場全体を成長させ、それは本当に誰にとっても良いことなのです。
Digital Foundry: アーキテクチャの観点から見ても、興味があります。 GPU がすでに備えている現在のユニットを再利用したり、一般的なコンピューティングだけに依存するのではなく、たとえばレイ トレーシング ユニットなどの専用ハードウェアに依存するのはなぜでしょうか?
Tom Petersen: その大きな理由は、レイ トラバーサルを実行しているときに起こっていることの性質が大きく異なるためです。このアルゴリズムは、従来のチャンクごとに複数のピクセルを処理し、複数の処理を並行して実行するものとは大きく異なります。したがって、これらの光線が三角形と交差する場所を見つけようとしていると考えてください。これは分岐スタイルの関数であり、必要なのは複数の異なるスタイルのユニットだけです。これは本当にアルゴリズム的なもので、「シェーダーですべてを実行しましょう」というのが望ましいですが、実際はそれは非効率です。ただし、Nvidia が古い GPU で使用できるバージョンを作成したことは知っていますが。専用ハードウェアとシェーダーのパフォーマンスの違いを覚えていますか?ドラマチックですね。それはアルゴリズムが非常に異なっているからです。
YouTubeビデオのカバー画像
Digital Foundry: 全体的な戦略に関する質問です。2 つのチップを含むスライドがありましたが、1 つのチップ設計を示しました。計画としてはスタックを用意することになると思いますね。さまざまなパーツがあり、GPU が 1 つだけ登場するわけではありません。 DG1 シリコンにはまだ果たすべき役割があるのでしょうか、それともそれ自体がテスト実行のようなものでしたか?
Lisa Pearce: はい、DG1 は、さまざまな問題の多くに対処するための最初のステップであり、スタックを確実に準備することが、ドライバーを調整して準備する最初のステップでした。したがって、DG1 は私たちにとって非常に基本的なものでした。しかし実際には、Alchemist は優れたグラフィックス パフォーマンスの GPU の始まりにすぎません。そして、多くの追随者が現れるでしょう。それが、これらのコード名のいくつかを共有した理由です。それは間違いなく複数年にわたるアプローチです。
Digital Foundry: シリコンと同じくらいプロジェクトにとって基本的なもの、つまりソフトウェア スタックに移りましょう。これは継続的なアプローチのようです。何年もかけて、Intel グラフィックスをより直接的に意識し始めたのは、Ice Lake (第 10 世代 Core) からだったと思います。そして明らかに、それ以来、あなたは飛躍的に進歩しました。しかし、ソフトウェア スタックの開発戦略は何でしょうか? 2022 年第 1 四半期にローンチすることになったら、実際にはどこになりたいと考えていますか? 現在どこにいて、今日の主な成果は何ですか?
リサ・ピアース: そうですね、私たちはしばらくの間 Xe HPG の準備をしてきました。そしてその大きな部分は、LP を備えた統合グラフィックスから HPG までスケーラブルなアーキテクチャを備えたドライバー スタックです。そして、HPC を使用した他のアーキテクチャについても同様に話しました。そして、それはドライバー設計の基本であり、昨年始まりました。昨年の Architecture Day で、Monza について話しました。Monza は、そのスケーリングに備えるための 3D ドライバー スタックへの大きな変更でした。これが最初の基本であり、その後、さまざまなセグメント、さまざまなパフォーマンス ポイントに合わせて調整し、それぞれの固有のアーキテクチャ製品ポイントのあらゆる側面を実際に絞り出す方法を成熟させることに努めます。
そのため、ドライバー内では、特に今年はこの発売に備えて、4 つの主要な取り組みが行われてきました。最初の 3 つは、特に HPG に固有のものというよりも一般的なものです。 それでは、ローカル メモリの最適化を試みますが、それをどの程度うまく活用できるでしょうか?私たちのメモリフットプリントはどのくらいでしょうか?各タイトルのローカル メモリに正しいものを入れていますか?次に、ゲームのロード時間のパフォーマンスです。今年のロード時間は平均で約 25% 短縮されました。もっと重いものもあります。作業は続いています。そのため、発売に向けて第 1 四半期に向けてやるべきことがたくさんあります。 3 番目は CPU 使用率、CPU バウンドのタイトルです。平均については控えめに述べましたが、平均 18 パーセントでした。[しかし] 一部のタイトルでは 80 パーセント削減されました。つまり、それが実際に私たちが展開したモンツァスタックの成熟度であり、そこからパフォーマンスを絞り出そうとしていました。そして最後の問題は、もちろん、ドライバーが HPG (より大きなアーキテクチャ) にどれだけうまく情報を供給するかです。そして、これらすべてが続いています。特に DX11/DX12 では、新しいゲームや新しいワークロードを常に監視し、チューニングしています。そして、それが第 1 四半期まで発売まで続くことがわかります。
Digital Foundry: そうですね、低レベル API の時代に移行すると、ベンダー側による実際のドライバーの最適化は、開発者に起こっていることよりも後回しになるという認識があったからです。でもそんなことは起きていないですよね?
トム・ピーターセン: いいえ、そのようには機能しません。つまり、低レベル API のおかげで ISV はより多くの自由を得ることができ、本当に優れたテクノロジーが数多く生み出されました。しかし、結局のところ、ドライバーには依然として重い作業が必要であり、コンパイラーだけが全体的なフレーム パフォーマンスに大きく貢献するだけです。そして、それは今後も私たちが取り組んでいくものであることは間違いありません。
Digital Foundry: 最新のタイトルや最新の API に注目するだけでなく、インテルには、DX11 初期から DX11 以前の時代のレガシー タイトルとのパフォーマンスと互換性を向上させる計画はありますか?
リサ・ピアース: [ドライバーの最適化] の多くは、何よりも人気に基づいています。そのため、人々が使用している上位タイトルが最優先であることを確認するように努めています。もちろん、それらが最優先事項です…一部の重い DX11 タイトルだけでなく、DX9 タイトルも含まれます。また、地域に基づいて、最も人気のあるタイトルと使用される API の構成が異なるため、一般的です。ただし、もちろん、一部の新しい最新 API では優先度が最も高くなる傾向がありますが、DX9 の最適化も引き続き行われています。
Tom Petersen: アプリケーションに対して実行できることは多岐にわたります。これは、アプリケーションの外側で、「コンパイラを高速化したので、ドライバも高速化できるよ」といったことができるものと考えてください。しかし、他に何ができるでしょうか?ゲームを一種のブラックボックスとして扱っても、グラフィックスで実行できる非常に素晴らしいことがいくつかあります。そして私はそれらすべてを暗黙的なものだと考えています。それはゲーム開発者の統合なしで起こっていることです。しかし、ゲームの統合について話し始めると、できることはさらにたくさんあります。つまり、インテルは、我々が双方の立場にあり、暗黙的に行っていることもあれば、明示的に行っていることもたくさんある、という状況にあると感じています。
デジタルファウンドリ: わかりました。たとえば、暗黙的なドライバー機能に関して、Intel は HPG 製品ラインが最終的に登場するときに、より多くのドライバー機能を提供する予定ですか?たとえば、ハーフ リフレッシュ レートの v-sync、制御可能な MSAA、VRS オーバーシェーディングなどです。これは、Alchemist がハードウェア VRS をサポートしており、VR タイトルにオーバーシェーディングを使用できることを知っているためです。 HPG の発売に期待すべき、非常に具体的な興味深い点はありますか?
Tom Petersen: 興味深い機能がたくさんあります。これは単に優れたグラフィックス ドライバーであることを超えた良さだと思いますね。優れたパフォーマンスドライバーである必要があり、ワットあたりのパフォーマンス、実際にはトランジスタあたりのパフォーマンスで競争力があり、そのすべてを備えている必要があります。ただし、基本的なグラフィック ドライバーを超えた機能も推進する必要があり、それについては HPG の発売が近づくにつれて詳しくお知らせする予定です。だから私は「はい」と答えます、私はかなり自信を持っています。
Digital Foundry: それでは、XeSS の話に移りたいと思います。実際の動作を示すデモがあります。私たちは機械学習と機械学習の応用を大いに支持してきたので、これは非常に興味深いことです。そして、より多くのハードウェアで動作する可能性のある DLSS の適切な競合他社が市場に参入するのを見るのは本当に素晴らしいことであり、これが DLSS の普及の鍵であると思います。まず最初にお聞きしたいのは、インテルの観点から一般的に画像再構成技術を開発しようとした動機は何だったのか、そしてなぜそれを機械学習プロセスによって推進したのかということです。
Tom Petersen: そうですね、パフォーマンスと品質には継続性があると思います。考えてみると、低解像度でレンダリングすると高いフレーム レートが得られるか、高解像度でレンダリングするとフレーム レートが低くなる傾向があります。そして問題は、それ以上のことができるかということです。その答えは、そうです、以前のフレームやゲームの以前の履歴から情報を再利用する新しい方法を考え始めれば、他のすべての情報を取り込んで、より良いフレームを再構築するために使用できるということです。そしてそれが、これらすべての AI ベースのスーパー レンダリングまたはスーパー サンプリング技術で実際に起こっていることです。
そして結局のところ、これは大変な仕事です – 誤解しないでください – これはロケット科学であり、私たちは世界で最も優秀な AI 人材がそれに取り組んでいます。しかし、結果自体が物語っています。実際には、複数のフレームにわたる情報を補間するか統合することによって、より良い結果を得ることができます。そして、他のゲームからの数百万または数億のフレームを調べてニューラル ネットワークにトレーニングできる情報を追加します。本当に素晴らしい技術ばかりです。
Digital Foundry: つまり、そこでの説明では、バックグラウンドで大規模なトレーニング プロセスが存在し、おそらく特定のゲームの高度にスーパーサンプリングされた画像に基づいているように思えます。そして、そこから生成された重みに基づく推論が GPU 上でリアルタイムに実行されます。
トム・ピーターセン: ええ、もちろんです。そしてもちろん、その推論にはさまざまな側面があります。しかし、素晴らしい点は、特定のタイトルについてトレーニングを受けていないという意味で、それらは一般的なものであるということです。結局のところ、それらはすべて非常によく似ているため、この推論は複数のゲームにわたって機能します。このエンジンは、さまざまなゲームからの大量のデータでトレーニングし、それを複数の異なるタイトルで使用して素晴らしい結果を得ることができる、ほぼ世界最高のものだと私は考えています。
Digital Foundry: わかりました。さまざまな推論とそこで言及したパスについて話しますが、プレゼンテーションでは、DP4A パスだけでなく XMX パスについても具体的に言及していました。どれがインテル アーキテクチャーに固有でどれがそうでないか、また、インテル アーキテクチャーでのそれぞれのパフォーマンスと知覚的な画質の違いについて、さらに詳しく説明していただけますか。
YouTubeビデオのカバー画像
Tom Petersen: つまり、実際のところ、人々はこれらすべてのレンダリング技術とポストレンダー技術を混同しており、それらをすべて混ぜ合わせて「画像がより良くなる」ようにしているのです。しかし、実際には異なることがいくつか起こっています。一般的に、私はアップスケーリングと考えているもの、または人々がそれを「超解像度」と呼ぶこともあります。そこでやっていることは、単一のフレームから低解像度の画像を取得し、それを複数の異なるテクニックを使用して拡大することです。これは、多くの場合、良好な結果が得られる非常に高性能な手法ですが、利用可能なすべての情報を持っているわけではなく、以前にレンダリングされたフレームや動きベクトルについても認識しません。そして、これまでに生成されたすべてのフレームの履歴については実際には知りません。
したがって、そのアップスケーリング技術、またはアップサンプリング – アップスケーリングという方が適切な言葉だと思います – このテクノロジーを XeSS のようなもので起こっていることと比較すると、XeSS ではゲームの複数のフレームが取得されます。そして、動きベクトルを調べており、ネットワークにトレーニングされた以前にレンダリングされたフレームも調べています。つまり、従来のアップスケーリングよりも優れた特性を持つ新しいフレームを生成するために、より多くの情報を検討していることになります。
さて、その XeSS アルゴリズムをどのように実行するかを考えると、最初に説明したのは XMX エンジンです。これはシストリックであり、GPU で高速推論を行う従来の方法の一種です。もう 1 つの方法は DP4A です。これは、複数の異なるアーキテクチャにわたってより広範に採用できる、別の種類の単純な形式です。したがって、コア エンジンをサポートする Intel のハードウェア プラットフォーム上で、そのデバイス上で XeSS を利用できるようになると考えています。それはかなりクールですよね?言ってみれば、当社には複数のバックエンドがあり、それらはすべて共通の API の下にプラグインされています。そして、私にとって最も重要なことは、ISV がこれらの共通 A​​PI を探しているということです。したがって、彼らは 1 つの統合を行うことができます。
そして、その統合の下で、ISV が毎回再統合して再評価する必要がなく、エンジンを複数実装できるため、それがまさに XeSS であると期待しています。XeSS には、複数のベンダー間で動作することもできる標準化された API があります。 。したがって、XeSS の重要な戦略の一部はオープンであることであり、これらの API を公開しましょう。そして、ISV の作業を少し楽にするために、他の人にこれらを実装してもらいましょう。そして、時間の経過とともに、もちろん、この種のものが業界を超えた標準化された API に移行することが期待されていますが、そのすべてに時間がかかります。そこで、私たちが考えているのは、最初のバージョンを公開して、素晴らしいものにしてから公開し、API をオープンにして、時間が経つにつれて標準化しよう、ということです。
Digital Foundry: その一環として、独自の SDK (独自の API) を外部に設定し、最終的にはより広範に標準化されたものへと徐々に流れていく可能性があります。実際に一部として Microsoft DirectML を使用する最初の反復です。それの?
トム・ピーターセン: いいえ。それでは、それについて良い質問があります。なぜそうしないのですか?真実を言えば、XeSS の実装の一部である高性能カーネルに使用している独自の内部プログラミング言語があります。そして、今のそれらはすべて、非常にインテルの「キッチン」のような超最適化された融合カーネルであり、美しい、ほら、昔のアセンブリでコーディングしているようなものです。私は、小さなボールキャップをかぶったリチャードがそれをしているように想像できます。私たちには、XeSS を完璧に仕上げている人々が部屋いっぱいにいます。それが今日の私たちの状況です。しかし、時間が経つにつれて、Microsoft のシェーダ用 API が拡張され、おそらくこのすべてがシェーダ ベースになる可能性がありますが、そうではありません。 [現時点では] 従来のシェーダーは XMX スタイル アーキテクチャ用に最適化されていません。
Digital Foundry: ええ、記録のために書いておきますが、私は 6502 で [アセンブリ コーディングを] チェックアウトしました。私はそれくらいの年齢です。あなたのデモからさらに本質的な質問があったと思います。XeSS を介して 4K にスケーリングされた 1080p を表示していました。さまざまな内部解像度をサポートする予定ですか?
Tom Petersen: そうですね、XeSS が複数の異なる構成をサポートしていることがわかると思います。品質モードやパフォーマンス モード、さまざまな入力解像度とさまざまな出力解像度のようなものがあります。そのクロスマトリックスが今どうなるかはわかりません。しかし、これを単に「1 つ入力、1 つ出力」にする必要はありません。
Digital Foundry: SDK 側について言えば、これらの機能はすべて、実際にタイトルに実装されることで生きて消えますよね。では、オープンとはどの程度オープンなのでしょうか? GitHub 上のソース コードについて話しているのでしょうか、それとも Nvidia が DLSS SDK で行ったことに近いものについて話しているのでしょうか?
Tom Petersen: つまり、オープンな ISV API を持つことは間違いなくすべての人の利益になるということです。これが意味するのは、文字通り同じ API であり、誰もがそれを統合し、その下にエンジンを実装するさまざまな DLL をプラグインすることであり、基本的には機能を実装することになります。それには少し時間がかかりますよね?したがって、短期的には、私たちがおそらくやることは、API を公開し、SDK を公開し、リファレンスを公開することです。そうすれば、ISV は自分たちが何を得ることができるのかを効果的に知ることができます。そして、それについて私にとって不快に感じることは何もありません。時間が経つにつれて、ユーザーがその下にプラグインできる API が存在する、さらにオープンになりたいと考えるようになります。そしてそれが事実上の戦略なのです。現在でも、これらの API の下にプラグインする独自の内部エンジンが存在する可能性が非常に高いです。そして時間が経つにつれて、それらがオープンになるかどうかは明らかではありません。
Digital Foundry: では、他のベンダーのどの GPU がそれを実行するかについて、実際にはある種の制限があるのでしょうか?つまり、何らかの機械学習アクセラレーションが必要になると思いますよね?
Tom Petersen: それは、実際には他のベンダーに対する質問ですよね?これらの機械学習スタイルのアプリケーションが、GPU を使用せずに実行されているのを見たことがあるでしょう?特定のハードウェアが必要な理由はありません。これは、パフォーマンスと品質の一種の複雑さのトレードオフにすぎません。
Digital Foundry: Architecture Day 中に私が抱いた興味深い考えがあります。それは、本質的に、機械学習シリコンは GPU だけでなく CPU にもあるということです。たとえば、私は古い GeForce または Radeon カードを所有しており、XeSS を利用したいと考えています。 CPU経由で実行できますか?
Tom Petersen: そうですね、当社のほとんどの CPU には統合型 GPU が搭載されていることはご存知でしょう。それで、問題は、それはどのように見えるかということです。そして、ほとんどのノートブックでハイブリッドがどのように機能するかはご存知かと思いますが、個別の GPU でレンダリングが行われ、統合 GPU へのコピーがあり、今日では実際にディスプレイ コントローラーとして機能する以外に何もしません。しかし、本当に素晴らしいテクノロジーを手に入れた今、GPU で何か面白いことができるでしょうか?私たちはその空間全体をディープリンクと呼んだと思います。そしてディープリンクに関して今何が起こっているのか、私たちはここでまだ多くのことを学んでいます。そしてチャンスはたくさんあります。現在、連携しているのはインテル製品だけですが、ディープ リンクについては、2 つの GPU 環境または CPU/GPU 環境で他の環境よりも優れた何ができるか、というようなものと考えることができます。したがって、その質問に直接答えるつもりはありませんが、この分野には多くの機会があると言わせてください。
Digital Foundry: Intel の観点から見ると、機械学習シリコンに対応できるのであれば、それが CPU 上にあるか GPU 上にあるかは基本的に問題になりますか?それが私がずっと考えてきた質問です。
Tom Petersen: それはパフォーマンスです、ご存知のように、ワットあたりのパフォーマンスです…パイプラインを通過するピクセルに影響を与える適切な場所の計算です。それについては宗教はありません。まさに、科学は私たちをどこへ導くのでしょうか?顧客にメリットをもたらす機能はありますか?もしそうするなら、ええ、おそらくそうするでしょう。つまり、当社の CPU で他社の CPU よりも優れたエクスペリエンスを実現する優れたテクノロジーを見つけたら、躊躇することはありません。
Digital Foundry: この GPU アーキテクチャでのレイ トレーシングのセットアップに関する簡単な質問です。複数のことを高速化する専用のレイ トレーシング ブロックがあります。メインコア領域の外側にあるように見えるため、通常のベクトルエンジンまたはXMXエンジンと同時に実行して、使用率、飽和度をさらに高めるか、同時に最も多く動作するGPU並列処理だけを実行できますか。
トム・ピーターセン: 残念ながら、その答えはわかりません。そうだと思いますが、それを再確認するつもりはありません。まあ、それは素晴らしい質問ですが。ホストをスタンプしてください!
Digital Foundry: Architecture Day で公開され、話題になった多くの素晴らしいテクノロジー。そして明らかに、最後にはムーンショット、ヴェッキオ橋がありました。これは、私たちが主流の消費者向けグラフィックスに関して話していることとはまったく異なる領域です。ただし、原理的には、マルチチップ レベルでのスケーラビリティを示していましたね。複数の GPU を統合していました。そして、それらがどのようにリンクされているかという観点から見ると、それらは 1 つの一貫した全体として機能しているように見えます。さて、明らかに、ゲーム分野では、複数の GPU を統合してパフォーマンスを高速化するという概念は SLI によって消滅し、最新のアーキテクチャ、特に一時的なアプリケーションには実際には拡張できませんでした。ここでの私の質問は、将来を見据えたものです。ヴェッキオ橋スタイルのテクノロジーは消費者レベルまでスケールダウンできるでしょうか?
トム・ピーターセン: そうですね、また未発表の製品については話したくないのですが、ポンテ・ヴェキオの話に戻りましょう。 Ponte Vecchio のターゲットはコンピューティングですよね?そして、非常に簡単に、非常に自然にスケールを計算します。また、巨大なワークロード全体で複数のコンピューティング ダイを使用することは、非常に簡単なスケーリング プロセスにすぎません。ソフトウェアによる大掛かりなマッピング作業は必要ありません。これは、スーパー コンピューターの負荷に関する問題の定義と非常によく似ています。それは消費者にとっては大きく異なります。 SLI を難しくしているものについて、外側から見た私の感覚を説明すると思います。これは SLI のマルチフレームの性質です。つまり、AFR (代替フレーム レンダリング) が SLI が使用するテクノロジであり、アイデアとしては、一時的に分離された各 GPU で 1 つのフレームをレンダリングし、それを [シーケンス] で表示するだけです。この手法は、後処理とフレーム間の相互通信により、最近のタイトルでは機能しません。
つまり、コンシューマでこれを行うには、新しいテクノロジ、つまり複数のタイルに作業を分割する新しい方法が必要になります。そして、そのタイル全体での高帯域幅通信の程度は、それらが複数のタイルであるという事実をある程度無視できます。あたかもタイル間に無限の帯域幅があるかのように、タイルは大きなシリコンのように見えるだけで、ソフトウェアに見える動作はありません。さて、帯域幅が無限になるわけではないので、タイル全体でそのスケーリングを行うには何らかの作業が必要になります。でもそれがトレンドだと思います。つまり、シリコンがどのように機能するか、歩留まりがどのように機能するかだけを見れば、長期にわたって複数のより小さなダイを使用することはおそらく非常に良いアイデアであり、それが何らかの方法で機能するようにする必要があるでしょう。 SLIのようなものにはなりません。 SLI は、DX9 および DX11 でうまく機能したテクノロジーです。何か違うものになると思います。
Digital Foundry: この質問はもう少しグローバルなもので、基本的に開発者との関係に関するものです。これは、シリコンやドライバーと同様に優れたパフォーマンスを得るために不可欠なためです…実際には、開発者と協力して開発者との関係を支援する必要があります。特定のアーキテクチャ向けに最適化します。そこでのインテルのビジョンは何でしょうか?そのようなアイデアはどのように展開されていますか?
Lisa Pearce: 私たちはインテル全体でゲーム ISV と長い間深い関わりを持ってきました。しかし現在は、エンジニアリングがさらに深く関与する段階にあります。過去 2 年間にわたって構築されてきたもので、これが成功と高性能コンシューマ グラフィックスにとって重要な賭けであることを私たちは知っています。そのため、Alchemist では、より強力な [関係] を構築し、より有能なツール、より有能な SDK を提供し、Alchemist で最高のゲーム体験が得られるように支援してきました。そして、今後数年間で、最終的には、ドライバーのゼロデイ調整をはるかに超えるものになると予想されます。事前のチューニング、事前の取り組み、おそらく最終段階に入る前から実行できるいくつかの独自の最適化などです。打ち上げ用に。したがって、私たちはこれらの関係が個別グラフィックスの将来にとって絶対に重要であると考えています。
Digital Foundry: ゲームに特化したものではなく、ゲームに関連した機能を強化する動きもあります。たとえば、ストリーミング。現状はどうなっているのか、また今後の計画はどうなっているのでしょうか?
Lisa Pearce: ご存知のとおり、ストリーミングにおいて、これはディープ リンクが今後も改善が必要な興味深いテクノロジーであると私たちが実際に考えているケースの 1 つです。システムに統合グラフィックスと個別グラフィックスを搭載すると、常に素晴らしい結果が得られます。キャプチャとストリーミングもその 1 つであり、当社のエンコーダはしばらくの間強みとなってきました。高いパフォーマンスのバランスを確実に活用するにはどうすればよいか、どのような品質レベルが必要か…そこにもたらしたい明確なソリューションはたくさんあります。そして、Alchemist のリリースでそれについてさらに詳しく知ることができます。
Digital Foundry: HPG と HPC のセットアップの違いに関してちょっとおまけの質問がありますが、EU の幅はかなり広く、HPC 分野では 2 倍ほど広いことに気づきました。それを高性能グラフィックス セットアップで使用しないという設計上の決定は何ですか?
Tom Petersen: そうですね、明らかに、彼らがターゲットにしているセグメントがすべてです。さまざまなセグメントのワークロードでは、並列処理がより一般的です。そして、アーキテクチャの違いのほとんどは、アーキテクチャが調整するワークロードにあると私は考えています。
デジタルファウンドリ:残りの質問のために…機械学習に戻ります。基本的に、それは新しいフロンティアですよね?これは、可能性が無限にある場所です。しかし、ご存知のように、次の可能性は何ですか?明らかに、スーパーサンプリングは現時点で大きなものです。ゲーミングアリーナの次にどこに行くのかについて何か考えはありますか?
トム・ピーターセン:私は百万の考えを持っています!しかし、私は彼らについて話したくありませんリチャード!しかし、私はあなたにいくつかのことを伝えることができます。なぜなら、あなたが知っているので、それは今私にとっては簡単だからです。ポストレンダリングされたピクセルに取り組んでおり、ポストレンダリングピクセルに取り組んでいるので、パイプラインの早い段階で多くの情報を残しました。そして、問題は、より深い後ろからより多くの情報を融合させたり、物理エンジンを見にしたりするという考え方です…そして、投影やジオメトリの拡張など、レンダリングに供給している他のすべてのエンジンについてはどうでしょうか?したがって、ピクセルの前に実行されている実行中のアルゴリズムは、多くの、多くのアルゴリズムがあり、それらはすべて、何らかの生成アルゴリズムに供給する候補です。 AIは2つのことをします。 1つは、「ここに情報がある、ある種の合理的な方法でそれを前進させるつもりだ」と書かれている外挿です。しかし、それはまた幻覚を起こします。そこでは、あなたが言っているのですが、私は過去にこのようなものを見てきました。それで、ここに木があったらそれは素晴らしいことではないでしょうか?ご存知のように、これはAIが行うことであり、そのすべてがゲームに最適です。そして、多くの異なるアプリケーションがあります…

「大きなインタビュー:Intel Alchemist GPUとXess UpscalingがPCゲームをどのように変えるか」に関するベスト動画選定!

【なにこれ】14世代最安のIntel Processor 300、エントリークラスとしての性能は?Core i3-12100FとPentium Gold G7400と比較、検証してみた【自作PC】
XeSS 4K Upscaling Demo – Intel Architecture Day | Intel Technology

関連記事一覧