但他至少需要保证文字转WAV音频