CityDreamer4D 無邊界 4D 城市生成技術解析
隨著 AI 生成技術的不斷進步,南洋理工大學 S-Lab 團隊開發的 CityDreamer4D 成為目前最先進的 4D 城市生成系統之一。該技術通過 建築實例生成器、車輛實例生成器和城市背景生成器,能夠動態分離城市中的移動物體與靜態場景,並利用高效的鳥瞰圖標記技術實現逼真的無邊界 4D 城市建模。...
隨著 AI 生成技術的不斷進步,南洋理工大學 S-Lab 團隊開發的 CityDreamer4D 成為目前最先進的 4D 城市生成系統之一。該技術通過 建築實例生成器、車輛實例生成器和城市背景生成器,能夠動態分離城市中的移動物體與靜態場景,並利用高效的鳥瞰圖標記技術實現逼真的無邊界 4D 城市建模。...
隨著人工智慧(AI)技術的發展,語音交互系統正逐步實現更高層次的擬人化體驗。復旦大學 OpenMOSS 團隊推出的 SpeechGPT 2.0-preview 是一款基於百萬小時中文語音資料訓練的即時交互 AI 系統,具備擬人化語音表達能力,並實現百毫秒級低延遲回應。其創新技術涵蓋語音與文本模態融合、智慧語速與情感控制,以及即時打斷交互能力,讓 AI 語音體驗更自然流暢。
隨著人工智慧(AI)技術的不斷進步,AI生成圖像的應用已經成為數位藝術領域的重要趨勢。近期,一款名為「Raphael AI」的免費AI繪圖工具迅速爆紅,受到許多設計師、藝術家以及AI愛好者的關注。這款工具最大的亮點在於「完全免費、免註冊、無限制使用」,同時能夠生成高品質的藝術作品,並且下載圖片時不會...
人工智慧技術正在快速發展,VARGPT 作為一款創新的多模態大語言模型,將視覺理解與圖像生成統一在同一框架內,極大地提升了 AI 在視覺-語言任務上的適應性與表現。該模型基於 自回歸框架,透過 next-token 預測 來進行視覺理解,並透過 next-scale 預測 來生成高品質圖像,為多模態人工智慧領域帶來了革命性的進步。
在 AI 工具快速發展的時代,如何高效管理不同的大語言模型(LLMs)、整合雲端與本地 AI 運行、同時處理多種檔案格式,成為許多開發者、研究人員與內容創作者的需求。Cherry Studio 正是為了解決這些問題而誕生的一款 多模型 AI 桌面客戶端,支援 Windows、macOS 和 Linu...
在這個資訊爆炸的時代,如何高效整理筆記、計畫任務、追蹤健康狀況,成為許多人的日常挑戰。Stackie.AI 是一款創新的 智慧記錄與 AI 內容管理應用,透過 生成式 AI 技術,幫助使用者自動整理資訊、生成個性化筆記、清單與備忘錄,並支援 多模態輸入(文本、語音、圖像),讓記錄更高效、更智慧。 S...
隨著 大語言模型(LLMs) 在各領域應用的增加,如何評估其 準確性、可靠性與業務適配度,成為企業和研究機構的重要課題。LalaEval,由 香港中文大學(CUHK)與貨拉拉(Lalamove)數據科學團隊 共同研發,是一款 專為特定領域 LLM 設計的人類評估框架,已成功應用於 物流行業,幫助企業...
隨著 AI 技術的進步,視頻生成與處理正在逐漸從高端運算設備擴展到移動端。MobileVD(Mobile Video Diffusion) 是首款專為 移動設備優化 的視頻擴散模型,由 Qualcomm AI Research 團隊開發。該模型基於 Stable Video Diffusion(SVD) 的 時空 UNet 架構,透過降低幀解析度、多尺度時間表示以及剪枝技術,大幅減少記憶體與計算成本,使 AI 生成視頻能夠 在手機等移動設備上高效運行。
在 AI 領域,大語言模型(LLM)經常會產生未對齊(unaligned)或不符合人類價值觀的回應,因此如何提升模型的對齊性成為重要研究課題。Aligner,由北京大學(PKU)研究團隊開發,是一種全新的大語言模型(LLM)對齊技術,通過學習答案修正殘差,幫助 AI 生成更準確、安全且符合人類價值觀...
在快節奏的數位時代,高效的任務管理與溝通工具已成為提升生產力的關鍵。Martin,由耶魯與伯克利輟學生共同創立,是一款全新的人工智慧助手,透過語音交互,提供個人化的日程管理、郵件處理、任務安排與通訊管理。 不同於傳統 AI 助手,Martin 採用「自訂記憶架構」,能夠學習用戶的習慣與偏好,提供更符...