因为人们已经预见到文字转WAV音频