VideoLAN/VLCプロジェクトのリード開発者として知られるJBことジャン=バティスト・ケンプ氏が、動画伝送における遅延を可能な限り低減するために設計されたリアルタイム制御SDK「Kyber」を発表しています。KyberはFFmpegやVLCなどのオープンソースプラットフォーム上に構築されており、クラウドゲーム、ロボット工学、ドローン、遠隔操作車両など、超低遅延が求められるアプリケーション向けに設計されています。

Ultra-Low Latency Video Control - An Interview with Jean-Baptiste Kempf of Kyber - Streaming Learning Centerhttps://streaminglearningcenter.com/codecs/an-interview-with-jean-baptiste-kempf-of-kyber.htmlJean-Baptiste Kempf - Kyber: a new approach for real-time video and controls streaming based on Quic - YouTubeKyberは一方的な放送ではなく、クラウドゲーミングやリモートデスクトップ、ドローンやロボットの遠隔操作、あるいはクラウド上のパワフルなマシンで単一のアプリケーションを動かすアップストリーミングなど、双方向の制御が不可欠なユースケースを想定しています。Kyberは単なるライブラリではなく、クライアント、サーバー、そしてネットワークスタックまでを包括したソリューションです。映像・音声・字幕をストリーミングできるだけでなく、実装が難しいとされる入力の双方向ストリーミングにも対応しています。これにはゲームパッドの操作、マウスの動き、さらにはUSBコマンドの伝送も含まれます。従来のストリーミング技術が重視してきた品質や音声と映像の同期ではなく、遅延を極限まで削減することを最優先するのがKyberの特徴。このアプローチにより、映像伝送の遅延はわずか数フレーム、すなわち数十ミリ秒に抑えることができたとのこと。2024年に行われた講演では、「ストリートファイター6」をキャプチャした映像をKyberで伝送するデモ映像が公開されました。「ストリートファイター6」のトレーニングモードにはフレームメーターを表示する機能があり、クライアント側(左)とサーバー側(右)を見比べると約2フレーム、つまり約33ミリ秒の遅延にとどまっていることがわかります。また、2025年2月のインタビューでは、240Hzの環境かつカメラからディスプレイまでの「グラス・トゥ・グラス」伝送で、遅延をわずか8ミリ秒に収めることに成功したとJB氏は報告しています。さらに、WebRTCを一切使用していないのもKyberの大きな特徴で、サーバー側でFFmpegを「プッシュモード」で動作するよう再設計されています。同時に、VLCベースのクライアント側は音声と映像の同期処理やバッファリングを意図的に排除することで、遅延を極限まで削ぎ落としているとのこと。Kyberはクライアント側・サーバー側ともに、Windows、macOS、Linuxなどの様々なプラットフォームで動作し、あらゆる種類のハードウェアおよびソフトウェアのビデオコーデックをサポートする高い柔軟性を持っています。KyberはQUICおよびWebTransportを採用しており、映像や音声、制御信号といった全てのデータを単一のソケットに集約して効率的に伝送します。JB氏によれば、映像や音声データは、信頼性を保証する一般的なストリームとしてではなく、「データグラム」として送信されるとのこと。通信中にパケットロスが発生した場合、通常のプロトコルでは失われたデータを再送するため、その待ち時間が遅延の原因となります。しかし、Kyberは再送を待つ代わりに「RaptorQ」と呼ばれる前方誤り訂正技術を用い、受信側で失われたパケットを即座に復元します。この方式は、データ伝送に必要な帯域幅をわずかに増加させるものの、再送による致命的な遅延を根本的に排除できるため、全体の遅延時間を劇的に短縮することができます。さらに、Kyberはプロトコル全体を自ら制御しているため、ネットワークの揺らぎ、つまりジッターの増加を検知し、即座にエンコーダーへビットレートを下げるようフィードバックを送り、安定したストリーミングを維持することも可能です。また、入力情報の処理に関しては、Rustを用いてゼロから開発された専用サーバーが担います。このサーバーは、キーボードやマウス、ゲームパッドといった標準的な入力デバイスの操作を伝送するだけではなく、クリップボードのコピー&ペースト、ファイル転送、さらにはUSB/IPという高度な機能までサポートしています。これにより、例えばクライアント側のPCに接続したWacomのペンタブレットを、あたかもサーバー側のマシンに直接接続しているかのように遅延なくシームレスに遠隔操作することが可能になるとのこと。JB氏は、Kyberの性能は商用・非商用を問わず他に類を見ない最先端技術であると自負しています。KyberはAGPLライセンスの下、オープンソースとして公開される予定ですが、これは技術の普及を加速させるためだとのこと。一方で、企業が製品に組み込む際には商用ライセンスで提供するというデュアルライセンスモデルを採用し、コミュニティの成長とビジネスとしての持続可能性を両立させています。ただし、記事作成時点では、Kyberのソースリポジトリやドキュメントは公開されていない模様。なお、JB氏は次世代コーデックのVVC(H.264)について、特許問題がHEVC以上に複雑であることや用途がニッチであることから、大規模な普及には懐疑的な見解を示しています。しかし、FFmpegやVLCの目標は「すべてをサポートすること」であるという信念に基づき、自身の見解とは別にVVCのサポートを行っているとのこと。将来的には、多くの用途でH.264とAV1が主流となり、HEVCは放送分野で使われ続けるだろうと予測しています。