估计也就是凑出来一半左右文字转WAV音频