现在他们面临的最大问题在于文字转WAV音频