所以他们都得不到补充文字转WAV音频