只好按平均主义文字转WAV音频