我们很难算计到他文字转WAV音频