但照样很难接受这样的理论文字转WAV音频