在没有明确方位和感应的情况下文字转WAV音频