其目标点数量为九个文字转WAV音频