所以他现在只能按照最坏的情况来做文字转WAV音频