这些原本就是人工调制和刺激而成文字转WAV音频