而且从外面杂乱的声音应该就知道文字转WAV音频