所以就得站在谢家得角度考虑文字转WAV音频