我们可以思考用更成熟的策略方式来加入和推动文字转WAV音频