他很少去关心具体的划分细节文字转WAV音频