这两方面都暂时不需要考虑文字转WAV音频