xAI「Grok Imagine 1.5」が画像→動画で外部ベンチマーク1位、720p対応の実力

AI論文
⚠ この記事は AI が生成した下書きをもとに、編集部が確認・編集しています。

xAIは2026年6月3日(現地時間)、画像から動画を生成する新AIモデル「Grok Imagine 1.5 Preview」を発表した。1枚の静止画と、動きを説明する自然言語のプロンプトを入力すると、カメラワークや雰囲気、物理表現を含む動画を生成できる。xAI APIでプレビュー提供されており、最大720pのクリップ…

引用元: xAI、画像1枚から最大720p動画を生成する「Grok Imagine 1.5 Preview」発表 外部ベンチマークで1位・2位に (Ledge.ai 編集部)

📰 元ネタの内容

xAIが2026年6月3日、画像から動画を生成する新AIモデル「Grok Imagine 1.5 Preview」を発表。1枚の静止画と動きを説明するテキストプロンプトを入力すると、カメラワークや物理表現を含む最大720p解像度の動画を生成できます。

  • 提供方法:xAI APIでプレビュー提供中。モデル名は「grok-imagine-video-1.5-preview」
  • 機能:入力画像の細部や照明を保持しながら動画化。ユーザーはカメラの動き、映像のペース、サウンドデザイン、解像度、動画の長さを指定可能
  • 複数ショット対応:複数の静止画を個別にアニメーション化し連結することで、長いシーンの構成にも対応。プロジェクト全体で一貫した見た目を保つことができる
  • 非対応機能:現時点ではテキストのみから動画を生成する「text-to-video」には対応していない。あくまで「image-to-video」モデル
  • 外部ベンチマーク成績:「Image-to-Video Arena」で1位(スコア1473±9、投票数5564、暫定順位)。「Artificial Analysis」の音声あり部門で2位、音声なし部門で3位
  • API料金:入力画像1枚あたり0.01ドル、出力動画は480pが秒あたり0.08ドル、720pが秒あたり0.14ドル
  • 背景:xAIは2026年1月に画像・動画の生成・編集に対応する「Grok Imagine API」を発表。今回は動画生成機能を強化した新モデル

関連ツール

  • ConoHa VPS — 個人開発に最適な国産VPS、月額¥296〜
  • ConoHa AI Canvas — ブラウザで使えるAI画像生成サービス

コメント

タイトルとURLをコピーしました