所以我的推算应该不会错文字转WAV音频