前者是自信文字转WAV音频