[閒聊] LTX2.3 GPT5.4 即時影片生成..本週AI新聞

作者error405 (流河=L)

看板AI_Art

標題[閒聊] LTX2.3 GPT5.4 即時影片生成..本週AI新聞

時間Sun Mar 8 11:56:55 2026

https://www.youtube.com/watch?v=KRE8JqTAEQk

https://i.meee.com.tw/8BoHOOJ.png

這段影片整理了當週最重大的 AI 新聞與工具更新，內容涵蓋影像編輯、影片生成、3D 重建及機器人技術。以下是根據你提供的資訊欄所做的簡要介紹：影像與影片編輯工具 Kiwi Edit (0:47): 開源影片編輯工具，支援風格轉換（如素描、卡通、水彩）、背景替換、新增或移除影片中的物件。 HY WU (2:45): 騰訊推出的圖像編輯器，特別擅長「換裝」與風格遷移，能精準保留參考圖的細節。 FireRed 1.1 (7:13): 強大的開源圖像編輯器，大幅提升了臉部一致性與複雜細節（如蕾絲、鞋子）的處理能力。 Free Edit (21:46): 透過修改影片的第一幀，AI 會自動將改動傳播到整段影片，確保編輯的一致性。 Hifi Inpaint (24:31): 專為廣告設計，能將產品無縫嵌入人物照片中，並精準保持產品的外觀。影片與 360° 生成 CubeComposer (5:02): 能將普通的一般視角影片轉換為全 360° 的影片，適用於 VR 內容。 Helios (9:42): 即時長影片生成器，能在單張 H100 GPU 上以每秒約 20 幀的速度生成長達一分鐘的影片。 RealWonder (23:09): 即時影片生成器，可模擬物體在受力（如水流、風力）影響下的動態反應。 LTX 2.3 (28:08): 開源影片生成器，內建原生音效，支援 4K 解析度與直式影片生成。模型更新與底層技術 Spatial T2I (11:57): 強化圖像生成模型對「空間關係」的理解（如左、右、上、下），讓物件擺放更符合指令。 Spectrum (15:22): ByteDance 開發的加速工具，透過預測未來步驟將影像與影片生成速度提升約 3.5 倍。 Cuda Agent (18:50): ByteDance 推出的 AI 系統，能自動撰寫並優化更快的 GPU 程式碼（CUDA kernels）。 Qwen 3.5 small (26:11): 阿里雲推出的小型模型系列（最低至 0.8B），可直接在手機或 Edge 設備上流暢運行。 GPT 5.4 (29:55): OpenAI 最新的 Frontier 模型，在推理、編碼及辦公自動化（ Excel、PPT）方面表現極佳。 3D、機器人與其他技術 Higgsfield Soul Cinema (17:49): 專為創作者設計的高端電影級圖像模型，具備豐富的紋理與光影。 Utonia (20:29): 統一的 3D 點雲編碼器，適用於自動駕駛、機器人與 3D 分割等多種任務。 Artifixer (30:30): 專門修復與增強稀疏 3D 重建場景，讓渲染出的畫面更連貫且細節豐富。 Diffusion Harmonizer (32:34): Nvidia 推出的技術，能即時修復模擬場景中的視覺瑕疵，讓貼入的物件與環境色彩、陰影完美融合。 OmniXtreme (34:02): 讓人形機器人能做出極限運動（如空翻、霹靂舞）的控制框架，動作流暢且符合物理限制。 Track4world (36:31): 能追蹤影片中每個像素在 3D 空間中的運動軌跡，可用於精準的動作追蹤與 3D 重建。最後，影片也提到與 Nvidia 合作贈送一張 RTX 5090 GPU (38:17)，參加者需註冊並參加 GTC 2026 線上或實體會議。 -- Gemini3整理 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.200.227 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1772942218.A.541.html

→ error405: https://www.koc.com.tw/archives/633673 LTX2.3 03/08 22:00

→ error405: 硬體門檻很高可惜了 03/08 22:00

推 YCL13: 那個需求是指廠商應用程式的需求，這個有開源，大家當然是 03/08 22:23

→ YCL13: 用量化版配適當工作流，所以一堆VRAM只有12G的人也在玩了 03/08 22:23

推 potatotato: LTX2.3做靜態或小幅度動態還不錯, 然後配音比2.0好很 03/09 07:53

推 Kroner: 最近天氣變化大，關節痛好像更嚴重了。 03/09 07:53

→ potatotato: 多. 03/09 07:53

推 potatotato: 那個亂碼字幕還是有機會跑出來. 03/09 07:55

→ gbcg9725: ltx2.3 12g vram 能跑了 03/10 09:52

→ gbcg9725: https://tinyurl.com/4j7mj7hf 03/10 09:54

推 Kroner: 想問一下有沒有關節痛的運動禁忌？怕動得更嚴重… 03/10 09:54

→ gbcg9725: 效果比預期好記得說明要看 03/10 09:54

→ error405: https://www.youtube.com/watch?v=KaQbt6NYrzY 03/11 11:59

推 kizajan: ltx2.3真的進步很多生成很快有人分享避免字幕的方法 03/15 17:14

→ kizajan: 消費級顯卡友善 03/15 17:15

推 Kroner: UC2推薦？有人試過嗎？靠譜嗎？ 03/15 17:15