推 march55237: 講結論不會 至於為啥請去了解下地端p 42.70.65.94 05/26 12:35
→ march55237: refill/inference著重哪些效能指標 42.70.65.94 05/26 12:35
→ jouhouya: 聊過了 220.129.13.240 05/26 12:50
推 w1222067: 自己試試就知道 別人的 多香了 36.233.89.68 05/26 13:03
→ w1222067: 沒有預算就是 免費 跟 訂閱 36.233.89.68 05/26 13:04
推 guogu: 看加速效果到底如何阿 畢竟LLM118.167.150.173 05/26 13:21
→ guogu: 本來就可以用ram+cpu跑118.167.150.173 05/26 13:21
推 smallreader: 你那顆內顯才亮機用的而已,別整了 223.138.63.103 05/26 14:45
→ spfy: 就是H300系列那種可以和系統記憶體共享的方 202.173.43.207 05/26 14:52
→ spfy: 式 但300系列最多只能用到75% 跑LLM就是純 202.173.43.207 05/26 14:53
→ spfy: 樂趣 以890M來沒有實用性 除非你跑3b8b小模 202.173.43.207 05/26 14:54
推 gohst1234: 把原本部分省道改叫作高速公路XD122.117.236.216 05/26 16:50
推 kkcity59: wdm建議給50%,amd跟nv就照wdm寫驅動 114.24.93.196 05/26 16:52
→ kkcity59: 你驅動愛占90%就佔90%啊 114.24.93.196 05/26 16:53
推 eddy13: 這個不是用NPU來跑AI嗎?114.137.220.180 05/26 19:56
推 smallreader: NPU比內顯更弱 只是做來給筆電省電用 111.254.191.95 05/26 20:03
推 kkcity59: 查了一下270kp的igpu它連主流ai 的fp8都 114.24.93.196 05/26 20:37
→ kkcity59: 沒有欸.....只有int8,遇到fp8得轉成fp1 114.24.93.196 05/26 20:37
→ kkcity59: 6交由gpu做剩下1.02tflops 114.24.93.196 05/26 20:37
推 chinesechang: 不是不快,是龜速,慢到沒有實用價 39.10.9.42 05/27 05:53
→ chinesechang: 值 39.10.9.42 05/27 05:53
推 eddy13: 原來NPU更爛哦,那做在桌機CPU根本是浪費114.137.220.180 05/27 08:39
→ eddy13: 沙子呀114.137.220.180 05/27 08:39
推 deolinwind: pentinum4有人實測可以跑llama3.2,就 1.172.117.33 05/27 10:17
→ deolinwind: 問你要不要 1.172.117.33 05/27 10:17
推 whizz: 你到底要跑什麼模型 參數多少223.141.245.192 05/27 10:51
→ whizz: 要lora還是rag223.141.245.192 05/27 10:51
推 whizz: Dgx一台 可以解決80%人的問題 不夠就串兩台223.141.245.192 05/27 10:54
→ whizz: 可以解95%人的問題 還不夠 就串4台223.141.245.192 05/27 10:54
推 smallreader: 不是只有2個埠 最多就串3台吧(x 223.139.186.96 05/27 11:35
推 gameguy: 這顆核顯才AMD 780M核顯1/3效能,而780M 59.127.199.201 05/28 20:42
→ gameguy: 核顯才9060XT 1/3性能,這顆核顯就拿來AV 59.127.199.201 05/28 20:42
→ gameguy: 1編解碼還行 59.127.199.201 05/28 20:42