お疲れ様です。 昨日(2025/8/6)にgpt-ossが発表されました。界隈がめちゃくちゃ盛り上がっていますね。
GPUのVRAMが16GBあれば一般のPCでも動かせる、その上かなりの高性能とのことで私もめちゃくちゃ気になっていたので試してみました。
環境について
OSがWindows11、GPUがRTX4046tiのVRAM16GBです。
WSLを使用し、DockerおよびDevcontainerを立ち上げました。
gpt-ossの実行環境にはOllamaを使用しています。
HuggingFaceのモデルをPythonで動かすこともできるのですが、VRAM16GB以内で動かすには私のGPUでは要件を満たしておらず断念しました…。
Devcontainerの設定ファイルはGitHubに置いてあります。
ドライバのバージョンの兼ね合い等あるかもですが、これさえ使えば動かせるはず…!
以前作成したuv環境のDevcontainerをベースに作成したものなので、Pythonも使用可能です。
立ち上げ後の設定
コマンドラインでOllamaを設定、実行します。
- サーバ立ち上げ
ダウンロードや実行などの操作の際このサーバを立ち上げた状態にする必要があります。
ollama serve

- モデルダウンロード
今回は目的の「gpt-oss:20b」を選択。他のモデルも指定可能です。
ollama pull gpt-oss:20b

- モデル確認
ダウンロード済みのモデルの一覧表示ができます。
ollama list

- 実行
「gpt-oss:20b」を指定して実行します。
ollama run gpt-oss:20b
長かったので返答の全文は載せていません。

ollama-pythonでも試す
Pythonも使用可能な環境なのでollama-pythonも試しました。 ollama-pythonはDevcontainer立ち上げ時に自動でインストールされるはず。 ない場合は下記のコマンドでインストールしてください。
uv add ollama
- コード
from ollama import chat from ollama import ChatResponse response: ChatResponse = chat(model='gpt-oss:20b', messages=[ { 'role': 'user', 'content': 'ollamaとは何ですか?', }, ]) print(response.message.content)
- 実行結果
文字数が多かったのでGitHubにmdファイルで個別に保管しています。 全文を確認する場合は下記URLを参照ください。
https://github.com/muetaek0321/uv-ollama-devcontainer-template/blob/master/example.md
