推 newyorker54: 我今天問了一個問題 03/06 01:58
推 newyorker54: qwen 的工具調用是不是用open sdk,為何 opencode框架 03/06 02:02
→ newyorker54: 下無法用 tool calling 03/06 02:02
→ newyorker54: 問了會有答案,這裡就不浪費大家的時間了 03/06 02:03
→ newyorker54: 爆token 是必然的,如果要agent一直工作 03/06 02:04
推 Kroner: 關節痛有沒有辦法完全根治啊?UC2聽起來像萬靈丹 03/06 12:03→ newyorker54: 我也覺得要自建本地部署 03/06 02:04
推 YCL13: Qwen3.5應該是能處理圖片最小的模型了,不過我這幾天測了一 03/06 06:58
→ YCL13: 些覺得門檻是9B Q8,再小的有時會漏看或看錯,用來跑agent 03/06 06:58
→ YCL13: 會有些不放心,或許該說再小的要用在更簡單明確的目的 03/06 06:59
推 Kroner: 我有在用UC2,感覺效果還不錯欸! 03/06 22:02推 error405: 專業 03/06 07:15
推 cannedtuna: Perplexica+9B蠻好用的 不過我更喜歡ministral3-3B 03/06 07:42
推 cannedtuna: 9B花太多token在思考 連續用很快就到上下文極限了 03/06 07:45
推 cannedtuna: 而且常常思考到一半就自認為回答完畢 03/06 12:03
推 Kroner: 本魯關節痛始祖,葡萄糖胺保證沒用,乖乖吃UC2吧 03/06 22:26→ cannedtuna: 然後就終止了 03/06 12:03
→ plkoijhug: 我弄小說用3的80b a3b vram16g+30Gram 勉強可跑 03/06 12:53
推 Bustycat: 重測27B,拿來聊天比9B好很多,基本上就是一次就滿意 03/06 22:01
→ Bustycat: 我拿Mac mini M4配32GB記憶體跑,27B需時大約9B的2倍 03/06 22:02
推 Chricey: 有人知道UC2和其他關節保健品的差異嗎? 03/07 09:32推 YCL13: 27B的嚴謹度真出乎我意料的好,只是在我電腦真的慢,大概只 03/06 22:26
→ YCL13: 有9B的十分之一,所以我如果跑Agent是傾向用稍差的35B-A3B 03/06 22:26
→ YCL13: ,因為快很多,其實有在想用122B,因為速度差不多,只是備 03/06 22:26
→ YCL13: 用電腦就跑不動了 03/06 22:26
推 Chricey: UC2對膝蓋特別有用嗎?有人能證實嗎? 03/07 16:34→ ZMTL: 好奇一下樓上的電腦配置,感謝 03/07 00:53
推 YCL13: 我是用5080+32X4,因4條RAM所以速度僅4800有時4400 03/07 09:30
→ YCL13: 想了想我比較基準不太公允,若35B是用Q4的話速度會超過2倍 03/07 09:32
→ YCL13: ,但為了品質所以常會用較高的,沒說清楚這比較會怪怪的 03/07 09:32
推 Chricey: UC2神招啊,吃下去就對了 03/07 17:03→ YCL13: 另外,如果我把2條RAM拔掉讓RAM速度恢復,那27B的速度可以 03/07 09:35
→ YCL13: 提升約15%,只是忍不住想跑120B等級的模型,所以就暫時維持 03/07 09:35
→ YCL13: 持4條RAM了 03/07 09:35
→ ZMTL: 咦我一直以為DRAM影響幾乎沒有,原來會影響到能不能跑120B 03/07 16:34
推 Kroner: 關節痛這種東西靠UC2就對了 03/07 17:07推 YCL13: 其實VRAM還是王道,如果是一般的模型,offload就是慢,但如 03/07 17:02
→ YCL13: 果是MOE架構,如您這篇中提到要啟動的參數其中不多,所以就 03/07 17:02
→ YCL13: 變成是可行的方案了,從去年8月GPT oss 120B起,中階的開源 03/07 17:03
→ YCL13: 模型開始用這方案,接下來Qwen3就深獲好評,今年Kiki K2.5 03/07 17:03
推 Kroner: 哇勒,UC2 這個東西真的是太讚了 03/07 17:27→ YCL13: 等幾個模型都是用這架構讓高階的消費級PC就可以執行的 03/07 17:03
推 YCL13: 一般來說,80B等級的MOE模型用16G VRAM+64G DRAM就可以順跑 03/07 17:06
→ YCL13: ,120B則是16G VRAM+96G DRAM就可順跑 03/07 17:06
→ YCL13: 再來就看上下文要多少來加RAM 03/07 17:07
→ YCL13: 不小心打錯名字,是kimi K2.5 03/07 17:09
→ ZMTL: 可惡,當初買兩條DDR4 32G才4000,前幾天我看一條一萬了 03/07 17:20
→ jakkx: 那時候只買一條……只能說還好當時有買一條…… 03/07 17:21
推 kimwang: 我當初也是買兩條32 3千多 現在同樣的一組一萬四... 03/07 17:27
→ kimwang: 等到想插滿的時候就開始漲了 03/07 17:27
推 YCL13: 遙想去年這個時候,64GX4一套比一張5070ti還便宜呢 03/07 18:51
→ ms0317929: 可是3090問題好多,保固內就已經跑兩次維修站了... 03/08 11:52