却是如普通人一样考虑简单文字转WAV音频