在加上前面十张残图的熟练文字转WAV音频