0%

OpenWeb_AI_Service.png

去年我在 2025 iTHome 鐵人賽 - 30 天帶你實戰 LLMOps:從 RAG 到觀測與部署Day17 - LLM 部署策略選型:雲端 vs 本地 vs 混合架構(成本與隱私) 有介紹過雲地部署 AI 模型大略的成本概念。所以我也想實際在我的地端環境裡面簡單的建置看看大語言模型服務,走過一遍實際的建置流程,才會有深刻的印象。

適用環境:RHEL 9 / OpenShift 4.20 / RTX PRO 4000 Blackwell GPU

我的環境建置成本和選型可以參考這篇:Homelab 神桌 2.0 建置紀錄

Read more »

某天早上看到這篇文章:Debugging image mode with Red Hat OpenShift 4.20: A practical guide,一開始我以為是 OpenShift 除了 debug pod 之後有新的除錯方法,後來發現這個 Image Mode 蠻有意思的,可以取代 Machine Config 的方式針對 OpenShiftworker node 預先除錯,縮短 troubleshooting 時間。

實驗目標: 在不驚動任何實體 Worker 節點的狀況下,利用 MachineOSConfig(Image Mode On-Cluster Layering)安全地 Dry-Run 編譯出一個內建 tmuxhtop 的客製化 RHEL CoreOS 9 作業系統映像檔。


注意事項

Caution

本文為了驗證單一 Technology Preview 功能而啟用 TechPreviewNoUpgrade,其影響不是只有功能層級,是整個 cluster 的生命週期:此設定不可逆,且後續無法進行 minor version upgrade。
X: 4.20 -> 4.21
O: 4.20.23 -> 4.20.24

Read more »

這篇是我在 HomelabRHEL 10.1 + KVM 切虛擬機,從零開始走完一遍 OpenShift 4.18 UPI(User Provisioned Infrastructure)c安裝的紀錄。UPI 相對於 IPI 的差別在於所有底層基礎設施:DNSLoad BalancerHTTP Web Server節點 都要自己準備,在雲端可以透過 Cloud Provider 自動搞定,安裝不難,但是需要耐心和細心。

Read more »

這篇是在 RHEL 宿主機上用 KVM / libvirt 管理虛擬機的操作紀錄,涵蓋建立、網路除錯、資源監控到完整刪除。原始設計是為了跑 OpenShift 實驗環境,不過這些指令和觀念拿來管理任何 VM 都適用。

Read more »

年初的時候,因為剛轉換跑道的關係有些空閒的時間,決定要重新建置很久沒碰的 Homelab。但說實在的消費級的硬體真的漲價太兇,不過錢都花了,就寫一篇部落格來紀錄錢包流血 homelab建置的想法和過程。

Read more »

Zero-Downtime Cloud Migration from GCP to AWS for IoT Devices

🔹 前言

真實環境往往不是「最佳實踐」,而是在崎嶇的路途中找到通往目的地的路。

這篇文章記錄的是:

  • ❌ 不是「很熟 GCP,所以很順利」
  • ❌ 不是「有完整的測試環境」
  • ❌ 不是「順利的搬遷可以立刻看到結果」

而是:

  • ✅ 沒用過 GCP
  • ✅ 用戶是全球數百萬台掃地機器人(你無法控制它們的 DNS cache)
  • ✅ 搬的是雲端更新系統(出錯就完蛋)
  • ✅ 零停機

如果你期待看到「完美的教科書案例」,這篇不適合你。
但如果你想知道 在有限的條件下,怎麼完成零停機遷移任務,Let’s go。

Read more »

2022 年終於要結束了,今年仍舊是在精神時光屋中度過…

在新的工作內容中恰好碰到了客製化 Terraform Provider 的需求,所以寫一篇文章來記錄一下開發和 Release 的流程,本篇文章假設已經對於 Terraform 這套 IaC 工具使用有基礎的了解,如果沒有聽過或使用過的人可以先拜讀 Che-Chia (David) Chang 大大的 2021 鐵人賽文章 - Terraform Workshop - Infrastructure as Code for Public Cloud 疫情警戒陪你度過 30 天,有助新手們由淺入深了解這套深度整合各大公有雲的 IaC 工具。

Read more »