为此他给自己先定下了一个最低的目标文字转WAV音频