或许他可以考虑文字转WAV音频