最好的答案就是沉默文字转WAV音频