根本不需要考虑留手文字转WAV音频