所以他们很容易选择文字转WAV音频