尽可能缩小投影脉络和主脉络的差距文字转WAV音频