目前训练的几套战术就是这样文字转WAV音频