主要是为了更有效的束缚文字转WAV音频