还会尝试着主动配合文字转WAV音频