看板 AI_Art
Google 推出 Gemma 4 開放模型,對抗 Llama、Qwen 搶攻開源 AI 市場 作者 蘇 子芸 | 發布日期 2026 年 04 月 03 日 10:01 | 分類 AI 人工智慧 , https://technews.tw/2026/04/03/google-gemma-4/ Google 宣布推出新一代開放模型 Gemma 4,主打可讓開發者自行下載與部署,並支援從 Android 裝置到資料中心 GPU 等多種硬體環境,包括 NVIDIA H100。該模型採用 Apache 2.0 授權,有助降低使用門檻並擴大開發者應用。 https://www.youtube.com/watch?v=jZVBoFOJK-Q
繼 2024 年 2 月與 5 月分別推出 Gemma 與 Gemma 2,並於 2025 年 3 月發表 Gemma 3 後,Google 持續加快開放模型布局。此次推出 Gemma 4,也被視為其在開源 AI 生態 中的最新進展。 Gemma 4 提供多種規模,包括 2B、4B、26B 與 31B 版本,能在不同硬體條件下運行。官 方表示,新一代模型在推理與任務處理能力上有所提升,同時兼顧效能與運算效率。該模 型亦針對硬體環境進行優化,未經量化的 bfloat16 權重可在單張 80GB 的 NVIDIA H100 GPU 上運行,而量化版本則可部署於消費級 GPU,支援開發者在 IDE、程式輔助工 具與代理式(agentic)工作流程中的應用。 在架構設計上,26B 混合專家模型(MoE)著重於降低延遲,在推論時僅啟用部分參數, 以提升運算效率與回應速度;而 31B Dense 模型則強調整體輸出品質,並提供更適合進 行微調(fine-tuning)的基礎能力。 https://imgs.plurk.com/QHO/mF8/H4s26rZK6fNtwTudeoMoZBrTJlO_lg.jpg
▲ Gemma 4 模型測試比較圖 在功能方面,Gemma 4 不僅可進行文字與程式碼生成,也支援影像與影片處理,部分模型 支援語音輸入。模型同時支援超過 140 種語言,並具備長文本處理能力,適合用於文件 分析與多語系應用。 Google 指出,Gemma 4 可在不同裝置上靈活部署,從 Android 裝置、筆電 GPU 到資料 中心皆可運行,進一步拓展行動與邊緣 AI 應用場景。 隨著 AI 發展加速,開放模型逐漸成為產業焦點。目前包括 Meta 的 Llama、阿里巴巴 的 Qwen 以及 Mistral 等模型皆積極布局,與閉源模型形成競爭。相較之下,開放模型 可讓企業自行部署,降低對雲端服務的依賴。 https://imgs.plurk.com/QHO/WLN/BAcE3QRaPHnhTKPgkw3RXAmya76_lg.jpg
▲ 性能與模型規模比較 --- 還沒有測跟Qwen的比較,但跑分目前看起來是贏過Qwen 3.5同級的模型, 大概就中文的部份不太確定,但我記得Gemma3作為中英本地翻譯模型還算厲害? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.161.127.42 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1775187123.A.6FB.html
error405: LMArena甚至拿了開源第三名 04/03 11:34
error405: gguf有出了 雖然我又跑不了 04/03 11:35