ワールドモデルとは何か?
ワールドモデルは、フラットなビデオクリップではなく、探索可能な3D環境を生成します。決定的な違いは再入(re-entry)にあります。シーンに戻り、一貫したジオメトリを確認することが可能です。
Happy Oyster
Alibabaがワールドモデル領域に参入したモデルです。「ディレクティング」と「ワンダリング」の2つのモードにより、リアルタイムでシーンを形成し、探索することができます。オーディオも同時に生成されます。現在は早期アクセス版です。
Sora
OpenAIのビデオモデルで、高品質なクリップを生成しますが、再入やリアルタイム編集には対応していません。ワンショットの映画的出力に最適です。
Runway
Runway Gen-4は強力な画像から動画への変換機能を提供しますが、2Dパイプラインのままです。3Dワールド生成機能はありません。
評価基準
以下の項目で評価を行いました:出力パラダイム(3D対2D)、再入の一貫性、オーディオ品質、アクセスのしやすさ、および価格。
結論
インタラクティブ性ではHappy Oysterがリードし、視覚的忠実度ではSoraがリードしています。速度とコストではRunwayが優れています。用途に合わせて選択してください。