看来他们也有着相当的考虑文字转WAV音频