如何使用 ElevenLabs 克隆您的声音

学习如何使用 ElevenLabs 高级 AI 工具进行声音克隆。按照本指南上传音频样本，创建高质量的数字语音模型。

录制高品质原始音频. 在安静的环境中使用专业麦克风录制一段 1 至 5 分钟的语音。确保语音清晰、语速平稳，且背景无任何电流声或杂音。将音频导出为 WAV 或 MP3 格式，建议采样率为 44.1kHz 或更高。
进入语音实验室. 登录您的 ElevenLabs 账户，在导航栏中点击 VoiceLab 选项卡。点击页面上的 Add Generative Voice 按钮，随后选择 Instant Voice Cloning 或 Professional Voice Cloning。对于大多数用户，Instant 版本已足够满足需求。
上传样本文件. 在弹出的窗口中为您的声音模型命名。点击 Upload Samples 区域，选择您准备好的音频文件。系统支持同时上传多个文件，确保所有文件语音风格一致，以提升模型准确度。
添加声音标签. 在 Description 字段中填写声音的特征描述，例如性别、年龄或口音。通过标签（Labels）功能标注语调特征，这将帮助 AI 在生成时更准确地重现声音细节。确认无误后，点击 Add Voice 按钮完成创建。
验证合成效果. 导航至 Speech Synthesis 页面，在 Voice 下拉菜单中选择您刚刚创建的克隆声音。输入一段测试文本，点击 Generate 按钮进行语音合成。如果效果不理想，请返回 VoiceLab 编辑并重新上传更具代表性的音频样本。