因为替换只能替换起点的文字转WAV音频