经过几次讨论并大胆假设之后文字转WAV音频