只是不同时候不同状态下的不同体现文字转WAV音频