这上面介绍的只是如何以观微之法融合自身所学文字转WAV音频