人家说的也才只是文字转WAV音频