看来应该是双手所张开的距离来控制能够压缩的空间文字转WAV音频