于是他只能老老实实的解释文字转WAV音频