这个时候原本是不该考虑这些问题的文字转WAV音频