要做的只能是严格执行文字转WAV音频