而且也分不清哪些是自己人文字转WAV音频