综合这些因素来考虑文字转WAV音频