这说明他们并非完全出于劣势文字转WAV音频