另外一半则是累的文字转WAV音频