[新]TTS-文本生成语音

1.103.25以上


与原来的区别

  • 将原本的文件右上角点击呼出一个面板,改为点击后生成一个新的配置文件

  • 生成一个新的.tts文件后,该文件就与原来的纯文本没有关联了,纯文本修改不影响这文件,所以需要修改就需要同时修改两侧

  • 因为以前的做法会导致左侧文本编辑后,右侧的一些修改行为出现未知的结果,无法通过diff算法来解决,而用户又可能认为会解决,所以配置丢失又不容易展示
  • 原来的设计需要左侧的内容与右侧有对应关系,但是如果引入了大语言模型自动提取,那么这种关系就会被打破,所以就需要重新设计

流程

  • 在文本文件点击后,普通文件会按照标点符号尝试解析,字幕文件会按照行解析
  • 解析后自动调用插件对每一项进行处理(通常是修改音频生成文本)

没有配置则不处理,为默认值

  • 解析后生成<文本文件名>.tts文件并自动打开
  • .tts文件与之前的文件不存在关联
  • .tts文件中进行修改,Ctrl + S保存
  • 点击右侧的文本到语音生成

编辑时使用插件

  • 由于.tts文件允许手动创建及编辑,所以如果插入新的行,也是可以使用插件进行处理的;点击每一项的插件处理会处理当前的配置
  • 注意,这里传入的是当前项的值,假设存在一个插件,会将1转换为2,2转换为3,而音频生成文本第一次输入为1,那么点击两次处理后,会变成3
  • 重置按钮表示将当前配置重置,重置值为第一次的初始值,如果是手动插入的新项,没有重置值

设置插件

  • 选中则表示启用

使用工作流处理文本