不过唯一相同的就是保持沉默文字转WAV音频