然后用每个人都能够清晰听到的声音一个字一个字地说道文字转WAV音频