そして、それらすべてがこのインタビューの基礎となっており、わかりやすく編集されています。このインタビューでは、私と #FriendAndColleague の Alex Battaglia が、Intel 副社長兼グラフィックス ソフトウェア責任者の Lisa Pearce と、エンジニアリングフェローの Tom Petersen に、Alchemist に何を期待するか、どれほどオープンでオープンかについて質問しました。標準化された XeSS が実際にどのようなものになるのか、同社がソフトウェア スタックで行ってきた作業、およびインテルの観点からグラフィックスの将来がどのように見えるかがわかります。ちなみに、私は野球帽をかぶったことがありません…
Digital Foundry: 明らかに、専用グラフィック分野への移行は、Intel にとって非常に興味深い展開です。開発には長い時間がかかりましたが、ここへの移行を秘密にしていませんでしたが、全体的な戦略は何ですか?なぜ専用のグラフィックススペースに参入するのでしょうか?
Digital Foundry: そうですね、低レベル API の時代に移行すると、ベンダー側による実際のドライバーの最適化は、開発者に起こっていることよりも後回しになるという認識があったからです。でもそんなことは起きていないですよね?
トム・ピーターセン: いいえ、そのようには機能しません。つまり、低レベル API のおかげで ISV はより多くの自由を得ることができ、本当に優れたテクノロジーが数多く生み出されました。しかし、結局のところ、ドライバーには依然として重い作業が必要であり、コンパイラーだけが全体的なフレーム パフォーマンスに大きく貢献するだけです。そして、それは今後も私たちが取り組んでいくものであることは間違いありません。
Digital Foundry: 最新のタイトルや最新の API に注目するだけでなく、インテルには、DX11 初期から DX11 以前の時代のレガシー タイトルとのパフォーマンスと互換性を向上させる計画はありますか?
リサ・ピアース: [ドライバーの最適化] の多くは、何よりも人気に基づいています。そのため、人々が使用している上位タイトルが最優先であることを確認するように努めています。もちろん、それらが最優先事項です…一部の重い DX11 タイトルだけでなく、DX9 タイトルも含まれます。また、地域に基づいて、最も人気のあるタイトルと使用される API の構成が異なるため、一般的です。ただし、もちろん、一部の新しい最新 API では優先度が最も高くなる傾向がありますが、DX9 の最適化も引き続き行われています。
Tom Petersen: アプリケーションに対して実行できることは多岐にわたります。これは、アプリケーションの外側で、「コンパイラを高速化したので、ドライバも高速化できるよ」といったことができるものと考えてください。しかし、他に何ができるでしょうか?ゲームを一種のブラックボックスとして扱っても、グラフィックスで実行できる非常に素晴らしいことがいくつかあります。そして私はそれらすべてを暗黙的なものだと考えています。それはゲーム開発者の統合なしで起こっていることです。しかし、ゲームの統合について話し始めると、できることはさらにたくさんあります。つまり、インテルは、我々が双方の立場にあり、暗黙的に行っていることもあれば、明示的に行っていることもたくさんある、という状況にあると感じています。
Tom Petersen: 興味深い機能がたくさんあります。これは単に優れたグラフィックス ドライバーであることを超えた良さだと思いますね。優れたパフォーマンスドライバーである必要があり、ワットあたりのパフォーマンス、実際にはトランジスタあたりのパフォーマンスで競争力があり、そのすべてを備えている必要があります。ただし、基本的なグラフィック ドライバーを超えた機能も推進する必要があり、それについては HPG の発売が近づくにつれて詳しくお知らせする予定です。だから私は「はい」と答えます、私はかなり自信を持っています。
Digital Foundry: それでは、XeSS の話に移りたいと思います。実際の動作を示すデモがあります。私たちは機械学習と機械学習の応用を大いに支持してきたので、これは非常に興味深いことです。そして、より多くのハードウェアで動作する可能性のある DLSS の適切な競合他社が市場に参入するのを見るのは本当に素晴らしいことであり、これが DLSS の普及の鍵であると思います。まず最初にお聞きしたいのは、インテルの観点から一般的に画像再構成技術を開発しようとした動機は何だったのか、そしてなぜそれを機械学習プロセスによって推進したのかということです。
Tom Petersen: そうですね、パフォーマンスと品質には継続性があると思います。考えてみると、低解像度でレンダリングすると高いフレーム レートが得られるか、高解像度でレンダリングするとフレーム レートが低くなる傾向があります。そして問題は、それ以上のことができるかということです。その答えは、そうです、以前のフレームやゲームの以前の履歴から情報を再利用する新しい方法を考え始めれば、他のすべての情報を取り込んで、より良いフレームを再構築するために使用できるということです。そしてそれが、これらすべての AI ベースのスーパー レンダリングまたはスーパー サンプリング技術で実際に起こっていることです。
そして結局のところ、これは大変な仕事です – 誤解しないでください – これはロケット科学であり、私たちは世界で最も優秀な AI 人材がそれに取り組んでいます。しかし、結果自体が物語っています。実際には、複数のフレームにわたる情報を補間するか統合することによって、より良い結果を得ることができます。そして、他のゲームからの数百万または数億のフレームを調べてニューラル ネットワークにトレーニングできる情報を追加します。本当に素晴らしい技術ばかりです。
Digital Foundry: つまり、そこでの説明では、バックグラウンドで大規模なトレーニング プロセスが存在し、おそらく特定のゲームの高度にスーパーサンプリングされた画像に基づいているように思えます。そして、そこから生成された重みに基づく推論が GPU 上でリアルタイムに実行されます。
Digital Foundry: わかりました。さまざまな推論とそこで言及したパスについて話しますが、プレゼンテーションでは、DP4A パスだけでなく XMX パスについても具体的に言及していました。どれがインテル アーキテクチャーに固有でどれがそうでないか、また、インテル アーキテクチャーでのそれぞれのパフォーマンスと知覚的な画質の違いについて、さらに詳しく説明していただけますか。
Tom Petersen: つまり、実際のところ、人々はこれらすべてのレンダリング技術とポストレンダー技術を混同しており、それらをすべて混ぜ合わせて「画像がより良くなる」ようにしているのです。しかし、実際には異なることがいくつか起こっています。一般的に、私はアップスケーリングと考えているもの、または人々がそれを「超解像度」と呼ぶこともあります。そこでやっていることは、単一のフレームから低解像度の画像を取得し、それを複数の異なるテクニックを使用して拡大することです。これは、多くの場合、良好な結果が得られる非常に高性能な手法ですが、利用可能なすべての情報を持っているわけではなく、以前にレンダリングされたフレームや動きベクトルについても認識しません。そして、これまでに生成されたすべてのフレームの履歴については実際には知りません。
そして、その統合の下で、ISV が毎回再統合して再評価する必要がなく、エンジンを複数実装できるため、それがまさに XeSS であると期待しています。XeSS には、複数のベンダー間で動作することもできる標準化された API があります。 。したがって、XeSS の重要な戦略の一部はオープンであることであり、これらの API を公開しましょう。そして、ISV の作業を少し楽にするために、他の人にこれらを実装してもらいましょう。そして、時間の経過とともに、もちろん、この種のものが業界を超えた標準化された API に移行することが期待されていますが、そのすべてに時間がかかります。そこで、私たちが考えているのは、最初のバージョンを公開して、素晴らしいものにしてから公開し、API をオープンにして、時間が経つにつれて標準化しよう、ということです。
Digital Foundry: その一環として、独自の SDK (独自の API) を外部に設定し、最終的にはより広範に標準化されたものへと徐々に流れていく可能性があります。実際に一部として Microsoft DirectML を使用する最初の反復です。それの?
Tom Petersen: つまり、オープンな ISV API を持つことは間違いなくすべての人の利益になるということです。これが意味するのは、文字通り同じ API であり、誰もがそれを統合し、その下にエンジンを実装するさまざまな DLL をプラグインすることであり、基本的には機能を実装することになります。それには少し時間がかかりますよね?したがって、短期的には、私たちがおそらくやることは、API を公開し、SDK を公開し、リファレンスを公開することです。そうすれば、ISV は自分たちが何を得ることができるのかを効果的に知ることができます。そして、それについて私にとって不快に感じることは何もありません。時間が経つにつれて、ユーザーがその下にプラグインできる API が存在する、さらにオープンになりたいと考えるようになります。そしてそれが事実上の戦略なのです。現在でも、これらの API の下にプラグインする独自の内部エンジンが存在する可能性が非常に高いです。そして時間が経つにつれて、それらがオープンになるかどうかは明らかではありません。
Digital Foundry: では、他のベンダーのどの GPU がそれを実行するかについて、実際にはある種の制限があるのでしょうか?つまり、何らかの機械学習アクセラレーションが必要になると思いますよね?
Tom Petersen: それは、実際には他のベンダーに対する質問ですよね?これらの機械学習スタイルのアプリケーションが、GPU を使用せずに実行されているのを見たことがあるでしょう?特定のハードウェアが必要な理由はありません。これは、パフォーマンスと品質の一種の複雑さのトレードオフにすぎません。
Digital Foundry: Architecture Day 中に私が抱いた興味深い考えがあります。それは、本質的に、機械学習シリコンは GPU だけでなく CPU にもあるということです。たとえば、私は古い GeForce または Radeon カードを所有しており、XeSS を利用したいと考えています。 CPU経由で実行できますか?
Tom Petersen: そうですね、当社のほとんどの CPU には統合型 GPU が搭載されていることはご存知でしょう。それで、問題は、それはどのように見えるかということです。そして、ほとんどのノートブックでハイブリッドがどのように機能するかはご存知かと思いますが、個別の GPU でレンダリングが行われ、統合 GPU へのコピーがあり、今日では実際にディスプレイ コントローラーとして機能する以外に何もしません。しかし、本当に素晴らしいテクノロジーを手に入れた今、GPU で何か面白いことができるでしょうか?私たちはその空間全体をディープリンクと呼んだと思います。そしてディープリンクに関して今何が起こっているのか、私たちはここでまだ多くのことを学んでいます。そしてチャンスはたくさんあります。現在、連携しているのはインテル製品だけですが、ディープ リンクについては、2 つの GPU 環境または CPU/GPU 環境で他の環境よりも優れた何ができるか、というようなものと考えることができます。したがって、その質問に直接答えるつもりはありませんが、この分野には多くの機会があると言わせてください。
Digital Foundry: Intel の観点から見ると、機械学習シリコンに対応できるのであれば、それが CPU 上にあるか GPU 上にあるかは基本的に問題になりますか?それが私がずっと考えてきた質問です。
Tom Petersen: それはパフォーマンスです、ご存知のように、ワットあたりのパフォーマンスです…パイプラインを通過するピクセルに影響を与える適切な場所の計算です。それについては宗教はありません。まさに、科学は私たちをどこへ導くのでしょうか?顧客にメリットをもたらす機能はありますか?もしそうするなら、ええ、おそらくそうするでしょう。つまり、当社の CPU で他社の CPU よりも優れたエクスペリエンスを実現する優れたテクノロジーを見つけたら、躊躇することはありません。
Digital Foundry: この GPU アーキテクチャでのレイ トレーシングのセットアップに関する簡単な質問です。複数のことを高速化する専用のレイ トレーシング ブロックがあります。メインコア領域の外側にあるように見えるため、通常のベクトルエンジンまたはXMXエンジンと同時に実行して、使用率、飽和度をさらに高めるか、同時に最も多く動作するGPU並列処理だけを実行できますか。
Digital Foundry: この質問はもう少しグローバルなもので、基本的に開発者との関係に関するものです。これは、シリコンやドライバーと同様に優れたパフォーマンスを得るために不可欠なためです…実際には、開発者と協力して開発者との関係を支援する必要があります。特定のアーキテクチャ向けに最適化します。そこでのインテルのビジョンは何でしょうか?そのようなアイデアはどのように展開されていますか?