我考虑还是单纯了一些文字转WAV音频