所以他还是认识一些的文字转WAV音频