总的来说就是认定了文字转WAV音频