gpt-ossを動かしたくてOllama環境をDevcontainerで作成した、試した記録

お疲れ様です。 昨日(2025/8/6)にgpt-ossが発表されました。界隈がめちゃくちゃ盛り上がっていますね。

GPUのVRAMが16GBあれば一般のPCでも動かせる、その上かなりの高性能とのことで私もめちゃくちゃ気になっていたので試してみました。

環境について

OSがWindows11GPURTX4046tiのVRAM16GBです。
WSLを使用し、DockerおよびDevcontainerを立ち上げました。

gpt-ossの実行環境にはOllamaを使用しています。
HuggingFaceのモデルをPythonで動かすこともできるのですが、VRAM16GB以内で動かすには私のGPUでは要件を満たしておらず断念しました…。

Devcontainerの設定ファイルはGitHubに置いてあります。
ドライバのバージョンの兼ね合い等あるかもですが、これさえ使えば動かせるはず…!
以前作成したuv環境のDevcontainerをベースに作成したものなので、Pythonも使用可能です。

github.com

立ち上げ後の設定

コマンドラインでOllamaを設定、実行します。

  • サーバ立ち上げ
    ダウンロードや実行などの操作の際このサーバを立ち上げた状態にする必要があります。

ollama serve

serve

  • モデルダウンロード
    今回は目的の「gpt-oss:20b」を選択。他のモデルも指定可能です。

ollama pull gpt-oss:20b

pull

  • モデル確認
    ダウンロード済みのモデルの一覧表示ができます。

ollama list

list

  • 実行
    「gpt-oss:20b」を指定して実行します。

ollama run gpt-oss:20b

長かったので返答の全文は載せていません。
run

ollama-pythonでも試す

Pythonも使用可能な環境なのでollama-pythonも試しました。 ollama-pythonはDevcontainer立ち上げ時に自動でインストールされるはず。 ない場合は下記のコマンドでインストールしてください。

uv add ollama

  • コード
from ollama import chat
from ollama import ChatResponse

response: ChatResponse = chat(model='gpt-oss:20b', messages=[
  {
    'role': 'user',
    'content': 'ollamaとは何ですか?',
  },
])

print(response.message.content)
  • 実行結果

文字数が多かったのでGitHubにmdファイルで個別に保管しています。 全文を確認する場合は下記URLを参照ください。

https://github.com/muetaek0321/uv-ollama-devcontainer-template/blob/master/example.md

ollama-python