马玉虚的计划应该是接近我们文字转WAV音频