而且两者的身份几乎都是一样文字转WAV音频