大きなGPUなしでローカル3D AIモデルをテストする方法（クラウドGPUワークフロー）

数週間おきに新しいオープンソースの 3D AI モデルが登場しますが、その半分には同じ落とし穴があります - 24 GB 以上の VRAM を要求するのです。私のカードは 14 GB。それでも、記事を書いたりアリーナに追加したりする前に、こうしたモデルをきちんとテストしたい。だから量子化ビルドやホスティング済みデモを待つことはしません - クラウド GPU を 1 時間借りて、AI コーディングエージェントにゼロからインストールさせ、実行します。

以下は、Roblox の CubePart を動かすために私が使ったそのままの手順です - すべてのコマンドを順番どおりに。モデルはあくまで例で、この同じフローはどんな重いローカル 3D AI リポジトリにも使えます。出力を見るだけでよければ、CubePart はすでに top3d.ai で公開中です - このガイドのテーマは、それを自分で動かすことです。

この記事で得られるもの

再現可能なレシピです：GPU を借り、エディターから SSH で接続し、安全なユーザーを作り、AI コーディングエージェントをインストールして、クローン＋インストール＋モデルの起動まで任せる - UI は自分のブラウザに引き込んだ状態で。シャットダウンすれば支払いも止まります。

この記事のきっかけになった実例：Roblox の CubePart のテスト。現在は top3d.ai で利用できます。

問題：24 GB 以上の VRAM を要求してくる

この記事を通しての例は Roblox CubePart、新しいオープンソースのローカルモデルです - が、ここではモデル自体はほとんど重要ではありません。重要なのは要件のほうです：Roblox は通常実行に 24 GB の VRAM を推奨していて、私のカードは 14 GB。これが壁であり、重いローカル 3D AI モデルの多くが目の前に置いてくるのと同じ壁です。品質を上げていけば 48 GB ですら足りなくなります。

CubePart は通常実行に約 24 GB を要求。私のカードは 14 GB - これが壁です。

ライセンス：研究用途限定 - 商用利用の前に確認を

Roblox は Cube / CubePart をオープンソースと呼んでいて、コードとウェイトは公開されていますが、ライセンスは Research-Only RAIL-MS - 学術・研究用途限定です。テスト・デモ・学習には問題ありませんが、Roblox からの追加許諾なしに商用製品や SaaS で使うことは認められていません。

解決策：クラウド GPU を 1 時間借りる

ハードウェアを買う代わりに、SSH アクセス付きの GPU を借りて、すべてをゼロからインストールし、テストを回して、シャットダウンします。今回は RunPod で A40（48 GB） を使いました - オーバースペックですが、余裕が欲しかったので。費用は 1 時間あたり約 $0.50 でした。

RunPod は単なる私の例 - スポンサーではありません

私は RunPod のスポンサードを受けていませんし、これは広告でもありません。単に私が使っているというだけです。SSH が使えるクラウド GPU ならどれでもまったく同じように動きます - 以下の手順はプロバイダーに依存しません。代替サービスをいくつか：

Vast.ai - マーケットプレイス方式で最安クラスの価格
Lambda Cloud - ML に特化したクリーンなインスタンス
Paperspace (DigitalOcean) - シンプルな時間課金 GPU
Modal / Replicate - コードファーストなサーバーレス GPU

クラウド GPU の過小評価されがちな利点

クリーンなマシンに、すべてをゼロからインストールします - 正しい CUDA ホイール、すべての依存関係、ローカル環境の残骸による競合もなし。重い 3D AI リポジトリは環境地獄で悪名高いですが、まっさらなインスタンスならその大半を回避できます。

完全なワークフロー、コマンド単位で

十分な余裕を持たせて Pod を起動する

RunPod では A40（48 GB）を選びました - 標準的な CubePart の実行なら 24 GB で足ります。見落としがちなのはストレージです：この手のプロジェクトは大量のウェイトをダウンロードするので、約 50 GB のコンテナと 最大 100 GB の永続ストレージを設定してください。

余裕を見て A40（48 GB） - 24 GB でも動きますし、もっと安くもできます。約 $0.50/hr。

SSH キーを追加して接続をテストする

SSH キーはただのファイルのペアです - 自分のマシンに置いたままにする秘密鍵と、プロバイダーに渡す公開鍵 - これでパスワードなしにログインできるようになります。 ssh-keygen -t ed25519 で一度だけ生成し、id_ed25519.pub の中身を RunPod の Settings → SSH Public Keys に貼り付けてから、Windows PowerShell で接続をテストします（ホスト / ポートは自分の Pod に表示されるものを使ってください）：

ssh root@<POD-IP> -p <PORT> -i ~/.ssh/id_ed25519

Pod のシェルの中に入れたら、成功です。

RunPod の公式ステップバイステップガイド（推奨）

RunPod には、SSH キーの作成、アカウントへの追加、IDE の接続までをスクリーンショット付きで分かりやすく解説したガイドがあります - そのまま従ってください： docs.runpod.io - Connect to your Pod from an IDE。

まず PowerShell で Pod の SSH コマンドをテスト - 接続できています。

Remote-SSH で Cursor / VS Code を接続する

Cursor（または VS Code）で Ctrl+Shift+P → Remote-SSH: Open SSH Configuration File を実行し、ホストブロックを追加します（HostName と Port には自分の Pod のものを記入）：

Host runpod-cubepart
    HostName <POD-IP>
    User root
    Port <PORT>
    IdentityFile ~/.ssh/id_ed25519

続いて Ctrl+Shift+P → Remote-SSH: Connect to Host → runpod-cubepart → Linux を選び、 /workspace フォルダーを開きます。残しておきたいものはすべてここに置く必要があります - シャットダウン後に残るのは永続ストレージだけです。

安全な非 root ユーザーを作成する

接続時は root です。AI エージェントを自由に走らせる前に、root として動作させないための普通のユーザーを作っておきます。Cursor のターミナルで、root のまま：

apt update && apt install -y curl git sudo

useradd -m -s /bin/bash stefan
mkdir -p /workspace/stefan
chmod -R a+rwX /workspace/stefan
ls -ld /workspace/stefan

そのユーザーに切り替えて Claude Code をインストールする

新しいユーザーに切り替え（再接続は不要）、エージェントをインストールします。ここから先、エージェントは root ではなく stefan として動きます：

su - stefan
cd /workspace/stefan

curl -fsSL https://claude.ai/install.sh | bash
source ~/.bashrc
claude --version

初回起動時に claude がログインを求めてきます - リンクをブラウザで開き、コードを貼り付けて戻ってください。

Remote-SSH で接続し、非 root ユーザーとして実行。エージェントのインストールとログインも完了。

エージェントをバイパスモードで起動して仕事を任せる

許可プロンプトをスキップした状態でエージェントを起動します - 隔離された使い捨てのクラウドマシンなので、ここでは安全です（Anthropic がこのモードを推奨するのはコンテナ / VM の中だけで、まさに今回がそれです）：

claude --dangerously-skip-permissions

ここから先、インストールコマンドを自分で打つことはありません。やりたいことを普通の日本語で Claude に伝えるだけです：CubePart のリポジトリをクローンし、依存関係ごとインストールし、モデルのウェイトをダウンロードして、簡単なテストを実行して、と。Claude はこの GPU にちょうど合う CUDA ホイールとコマンドを自分で割り出し、全部やってくれます。私が必ず明示する指示は 1 つだけ：/workspace にインストールすること。永続ストレージの外にあるものは、Pod のシャットダウン時にすべて消えるからです。

PyTorch ＋ CUDA のステップは気長に待つ

依存関係のインストールには 10〜15 分かかることがあります。エージェントが止まっているように見えるかもしれませんが - 止まっていません。準備が整ったら向こうから知らせてくれます。

依存関係が入り、ウェイトをダウンロードし、初回実行も通過 - すべて借りた GPU 上でエージェントが実行。

Gradio デモを頼んで自分のブラウザで開く

CubePart には Gradio アプリが付属しています（ComfyUI ビルドはありません）。Claude に、Gradio デモを起動して公開共有リンクで外に出すよう頼むだけです。アプリが起動し、 https://….gradio.live の URL が返ってきます - それを自分のラップトップで開けばフル UI が使え、モデルはクラウド GPU 上で動き続けます。そこから先はいつもの Gradio の流れです：GLB を放り込み、部位名を入力して、実行。

ローカルブラウザで動く gradio.live のリンク - モデルの実行はクラウド GPU 上。

これで終わり - 出力はどこで見られるか

方法はこれで全部です：ローカルでは動かせないモデルが、GitHub のリンクから自分のブラウザで動く UI まで、約 1 ドルでたどり着きました。同じフローは次の重いモデルにも、その次のモデルにも使えます。

CubePart が実際に何を出力するのか見たいですか？

結果をここで蒸し返すことはしません - CubePart はすでにサイトで公開されているので、私の言葉を鵜呑みにする代わりに直接確かめてください。 top3d.ai のセグメンテーションアリーナで開く。

コスト、後片付け、そしてこれが割に合うのはいつか

約 $0.50 / hr

A40 48 GB。テストセッション全体でも 1〜2 ドルです。

/workspace を使う

シャットダウン後も残るのは永続ストレージだけ。それ以外はすべて消えます。

目安は 24 GB

標準的な CubePart には十分。それ以上は解像度を上げたいときだけ。

終わったらその瞬間に Pod をシャットダウンしてください。課金は時間単位で、止めるまで動き続けます。モデルをたまにしか使わないなら、この方法は $2,000 超の GPU を買うより圧倒的に有利です - 実際に使った分の時間にだけ支払えばいい。毎日欠かさずモデルをテストするなら、その計算は逆転して、ローカルのハードウェアが意味を持ち始めます。

パターンを 1 行で

クリーンな GPU マシンを借りる → エディターから SSH で接続 → 安全なユーザーを作成 → AI エージェントをインストール → クローン＋永続ストレージへのインストールを任せる → 共有リンクで UI を公開 → テスト → シャットダウン。CubePart はもちろん、重いローカル 3D AI モデルならほぼ何にでも使えます。

これが、ハードウェアなしで重いモデルをテストする私のやり方です。新しいモデルは絶えず登場します - 登場するたびに、そのままアリーナに入るので、あなたは何もインストールせずに比較できます。