他说可以列入考虑文字转WAV音频