还是有他自己的考量和估计文字转WAV音频