DITTO-2 是 Adobe 與加州大學 聯合推出的 新型音樂生成模型,基於 擴散模型(Diffusion Model) 的 推理時間優化(Inference-Time Optimization, ITO) 技術,透過 模型蒸餾(Consistency Model, CM 與 Consistency Trajectory Model, CTM),達到 快速且可控的音樂生成,並且 生成速度比即時更快。
DITTO-2 的最大特色在於其 多樣化音樂生成功能,包括 音樂修復、擴展、強度控制、旋律控制、音樂結構控制 及 文本到音樂生成。透過 一致性模型與一致性軌跡模型 的結合,DITTO-2 不僅能夠 快速生成高品質音樂,還能實現 精確的音樂控制 與 文本驅動的創作。
本文將深入介紹 DITTO-2 的主要功能、技術原理、應用場景、操作教學及未來發展方向,幫助你快速上手並充分發揮這款工具的創意潛力。
DITTO-2 是什麼?

DITTO-2 是 Adobe 與加州大學 聯合研發的 新型音樂生成模型,基於 擴散模型(Diffusion Model) 的 推理時間優化(ITO) 技術,透過 模型蒸餾技術(CM 與 CTM),實現 快速且可控的音樂生成。
DITTO-2 的主要特色
- 快速且高品質的音樂生成:基於 推理時間優化(ITO) 技術,DITTO-2 的生成速度 比即時更快,並且 保持高品質的音樂輸出。
- 多樣化音樂生成任務:支援 音樂修復、擴展、強度控制、旋律控制、音樂結構控制 等多種音樂生成任務。
- 文本到音樂生成:DITTO-2 能夠將 無條件擴散模型轉換為具有先進文本控制能力的模型,通過 CLAP 分數最大化 實現 高品質的文本到音樂生成。
- 高效推理與優化:透過 一致性模型(CM) 和 一致性軌跡模型(CTM),DITTO-2 將 生成速度提升至比即時更快,同時 保持高品質與可控性。
DITTO-2 的應用平台
- 跨平台應用:DITTO-2 支援 Web 版與桌面版,適用於 音樂創作、即時音樂生成、音樂教育、多媒體內容創作 等多種場景。
- 多語言支援:DITTO-2 支援 多語言文本到音樂生成,適用於 全球音樂創作者與內容製作人。
DITTO-2 的 5 大功能亮點

1. 音樂修復與擴展
- 音樂修復(Inpainting):DITTO-2 支援 音樂修復 功能,能夠對 受損或缺失的音樂片段進行修補,無縫銜接音樂上下文。
- 音樂擴展(Outpainting):DITTO-2 可以 延續現有音樂片段,無需重新創作 即可 自動生成與原曲風格一致的延伸段落。
2. 強度控制與旋律控制
- 強度控制:DITTO-2 支援 音樂強度變化曲線控制,例如 從低到高或高到低的強度變化,適用於 情感曲線設計。
- 旋律控制:通過輸入 參考旋律,DITTO-2 能夠 生成與之匹配且和諧的音樂,保持旋律一致性 與 音樂和諧性。
3. 音樂結構控制
- 音樂結構控制:DITTO-2 支援 對音樂結構的精確控制,例如 定義 A 段和 B 段的時長、重複次數、過渡方式。
- 自定義音樂結構:使用者可以根據 音樂風格或需求,自定義段落結構與音樂佈局,提高音樂創作的靈活性。
4. 文本到音樂生成
- 文本驅動的音樂生成:DITTO-2 支援 文本到音樂生成,使用者只需輸入 簡單的文本描述,即可 自動生成符合描述的音樂。
- CLAP 分數最大化:透過 CLAP 分數最大化,DITTO-2 能夠 優化音樂與文本描述的匹配度,提高文本到音樂生成的品質。
5. 高效推理與優化
- 一致性模型(CM)與一致性軌跡模型(CTM):透過 CM 與 CTM,DITTO-2 將生成速度提升至比即時更快,同時改善控制粘附性和生成品質。
- 推理時間優化(ITO):通過 推理時間優化(ITO),DITTO-2 即時調整模型狀態,實現 對音樂強度、旋律、結構等的精確控制。
DITTO-2 的應用場景

1. 音樂創作與生成
- 文本驅動音樂創作:通過 文本描述,DITTO-2 能夠 生成符合情感、風格、場景的音樂,適用於 影視配樂、遊戲音樂、廣告音效 等。
- 音樂靈感生成:快速生成 音樂靈感片段,供 音樂創作者進行二次創作。
2. 即時音樂生成
- 比即時更快的生成速度:適用於 實時音樂創作、現場表演、直播配樂 等需要 快速生成音樂 的場景。
立即體驗 DITTO-2,探索音樂創作新世界!
常見問題與答覆
1. DITTO-2 是什麼工具?
DITTO-2 是 Adobe 與加州大學 聯合推出的 新型音樂生成模型,基於 擴散模型(Diffusion Model) 和 推理時間優化(ITO) 技術。它通過 模型蒸餾技術(CM 與 CTM),實現 快速且可控的音樂生成,支援 音樂修復、擴展、強度控制、旋律控制、音樂結構控制 和 文本到音樂生成 等多種功能。
2. DITTO-2 的主要功能有哪些?
DITTO-2 提供 音樂修復與擴展、強度控制、旋律控制、音樂結構控制、文本到音樂生成、高效推理與優化 等功能。通過 一致性模型(CM) 和 一致性軌跡模型(CTM),DITTO-2 將生成速度提升至比即時更快,同時 保持高品質與精確控制。
3. DITTO-2 的應用場景是什麼?
DITTO-2 適用於 音樂創作與生成、即時音樂生成、音樂教育、直播配樂、有聲讀物、播客、多媒體內容創作 等場景。它 支持文本驅動的音樂創作,並能夠 生成符合情感、風格、場景的音樂,提升音樂創作靈感與生產力。