使用 Docker 在本地執行 GPT-OSS 模型！

社群文章釋出於 2025 年 8 月 6 日

基於 Docker 的 GPT-OSS 聊天機器人

使用 Docker 在您自己的程式碼庫中本地執行 OpenAI 的開源 GPT-OSS 模型（117B / 21B）。此專案避免使用 Open WebUI 或 LM Studio 等第三方 GUI，以幫助您學習如何在應用程式中直接使用基於 GPT 的模型。

所有內容都透過 Docker 容器化，以實現乾淨、可重現的設定。這是一個有趣的輔助專案，旨在幫助其他人探索本地執行強大的語言模型。

✨ 歡迎貢獻！
如果您想協作或進一步增強專案，請隨時fork 該儲存庫並提交拉取請求。

專案倉庫：GitHub Repo

OpenAI 根據 Apache 2.0 釋出了 GPT-OSS 模型。以下是學習路徑：

gpt-oss-chatbot-dockerized/

├── backend/
│ ├── main.py
│ └── requirements.txt
├── frontend/
│ └── index.html
├── docker-compose.yml
└── Dockerfile

克隆倉庫

git clone https://github.com/Imran-ml/gpt-oss-app-open-source
cd gpt-oss-app-open-source

導航到專案目錄：確保您位於 gpt-oss-app-open-source 目錄中。
使用 Docker Compose 構建並執行應用程式
- 根據 Dockerfile 構建後端 Docker 映象。
- 拉取 ollama/ollama 映象和 nginx:alpine 映象。
- 啟動所有已定義的服務（Ollama、後端、前端）。
- ollama 服務配置為在啟動時自動拉取 gpt-oss 模型。首次執行時可能需要一些時間，因為需要下載模型。在 docker-compose 中，在這一行 "sh -c "ollama serve & sleep 5 && ollama pull gpt-oss && tail -f /dev/null""，您可以將 gpt-oss 替換為 gpt-oss:120b，如果您想要 120B 模型的話！
```
docker-compose up --build
```
您將在終端中看到所有容器的日誌。
訪問聊天機器人：服務啟動並執行後
- 開啟您的 Web 瀏覽器，訪問：https://:8080 與聊天機器人互動。
- 後端 API 可在 https://:8000 訪問。
- Ollama API 位於 https://:11434。

姓名: 穆罕默德·伊姆蘭·扎曼

職位: 首席機器學習工程師

專業連結: - HuggingFace: 個人資料 - Kaggle: 個人資料 - LinkedIn: 個人資料 - Google Scholar: 個人資料 - Medium: 個人資料

這很好，但需要新增一些關於需要在 compose 檔案中新增 GPU 的評論

runtime: nvidia
environment:
  - NVIDIA_VISIBLE_DEVICES=all
  - OLLAMA_NUM_GPU=1

透過拖放到文字輸入框、貼上或點選此處上傳圖片、音訊和影片。

點選或貼上此處以上傳圖片

· 註冊或登入發表評論