在话语中掺入了单调的沙沙声文字转WAV音频