根本就不会列入考虑文字转WAV音频