文本生成语音(tts)加速

全局配置加速

  • 设置后默认使用此策略对所有生成文本生效

部分加速

  • 对每一句进行加速配置

会和全局配置进行合并

加速策略

  • 按字幕: 当前字幕句子的起始到结束,如果音频的生成时间超过字幕时间,会计算加速倍率以适合字幕时间;下面的例子音频持续时间会在这个范围内00:00:00,000 --> 00:00:02,432

音频生成时间超过时会加速,没有超过时保持原速

1
00:00:00,000 --> 00:00:02,432
普通语速生成的句子
  • 按下一字幕开始: 当前字幕句子的起始到下一字幕句子的起始.下面的例子音频持续时间会在这个范围内00:00:00,000 --> 00:00:03,432
1
00:00:00,000 --> 00:00:02,432
普通语速生成的句子

2
00:00:03,432 --> 00:00:04,053
普通语速生成的句子
  • 固定速率: 始终按某个速率计算

与下一句间隔

  • 当前音频生成和下一音频生成要保持的最小间隔,低于后会进行变速

倍率

  • 固定模式下为直接加速,字幕模式为最大倍率,防止字幕持续时间过短导致音频加速过大

字幕加速计算公式

  • 音频生成持续时间/(字幕持续时间-间隔时间)=min(最大倍率,加速倍率)