我更加坚定了之前的推测文字转WAV音频