本身就是中央郑重考虑之后的决定文字转WAV音频