于是他就在考虑这个问题――要不要再进一个文字转WAV音频