此时他还能比较理智地分析当前的形式文字转WAV音频