因为每一次话语都会提醒他文字转WAV音频