所以他计算的一般也都是非常准确文字转WAV音频