看板 AI_Art
https://www.youtube.com/watch?v=KRE8JqTAEQk
https://i.meee.com.tw/8BoHOOJ.png
這段影片整理了當週最重大的 AI 新聞與工具更新,內容涵蓋影像編輯、影片生成、3D 重建及機器人技術。以下是根據你提供的資訊欄所做的簡要介紹: 影像與影片編輯工具 Kiwi Edit (0:47): 開源影片編輯工具,支援風格轉換(如素描、卡通、水彩)、背 景替換、新增或移除影片中的物件。 HY WU (2:45): 騰訊推出的圖像編輯器,特別擅長「換裝」與風格遷移,能精準保留 參考圖的細節。 FireRed 1.1 (7:13): 強大的開源圖像編輯器,大幅提升了臉部一致性與複雜細節( 如蕾絲、鞋子)的處理能力。 Free Edit (21:46): 透過修改影片的第一幀,AI 會自動將改動傳播到整段影片,確 保編輯的一致性。 Hifi Inpaint (24:31): 專為廣告設計,能將產品無縫嵌入人物照片中,並精準保持 產品的外觀。 影片與 360° 生成 CubeComposer (5:02): 能將普通的一般視角影片轉換為全 360° 的影片,適用於 VR 內容。 Helios (9:42): 即時長影片生成器,能在單張 H100 GPU 上以每秒約 20 幀的速度 生成長達一分鐘的影片。 RealWonder (23:09): 即時影片生成器,可模擬物體在受力(如水流、風力)影響下 的動態反應。 LTX 2.3 (28:08): 開源影片生成器,內建原生音效,支援 4K 解析度與直式影片生 成。 模型更新與底層技術 Spatial T2I (11:57): 強化圖像生成模型對「空間關係」的理解(如左、右、上、 下),讓物件擺放更符合指令。 Spectrum (15:22): ByteDance 開發的加速工具,透過預測未來步驟將影像與影片生 成速度提升約 3.5 倍。 Cuda Agent (18:50): ByteDance 推出的 AI 系統,能自動撰寫並優化更快的 GPU 程式碼(CUDA kernels)。 Qwen 3.5 small (26:11): 阿里雲推出的小型模型系列(最低至 0.8B),可直接在 手機或 Edge 設備上流暢運行。 GPT 5.4 (29:55): OpenAI 最新的 Frontier 模型,在推理、編碼及辦公自動化( Excel、PPT)方面表現極佳。 3D、機器人與其他技術 Higgsfield Soul Cinema (17:49): 專為創作者設計的高端電影級圖像模型,具備豐 富的紋理與光影。 Utonia (20:29): 統一的 3D 點雲編碼器,適用於自動駕駛、機器人與 3D 分割等多 種任務。 Artifixer (30:30): 專門修復與增強稀疏 3D 重建場景,讓渲染出的畫面更連貫且 細節豐富。 Diffusion Harmonizer (32:34): Nvidia 推出的技術,能即時修復模擬場景中的視 覺瑕疵,讓貼入的物件與環境色彩、陰影完美融合。 OmniXtreme (34:02): 讓人形機器人能做出極限運動(如空翻、霹靂舞)的控制框架 ,動作流暢且符合物理限制。 Track4world (36:31): 能追蹤影片中每個像素在 3D 空間中的運動軌跡,可用於精 準的動作追蹤與 3D 重建。 最後,影片也提到與 Nvidia 合作贈送一張 RTX 5090 GPU (38:17),參加者需註冊並參 加 GTC 2026 線上或實體會議。 -- Gemini3整理 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.200.227 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1772942218.A.541.html