但问题是曹振那边有那么一些不太好交代文字转WAV音频