在那个人还没有发出任何声音之前文字转WAV音频