这个时候他们两个是完全相信文字转WAV音频