但标准本来就是要越来越严格的文字转WAV音频