这个过程我认为不应该有任何人为的干扰文字转WAV音频