前面的这些对话按道理来说不用发生文字转WAV音频