首先是手和脚分解了文字转WAV音频