但是现在的一个难点就在于怎么让他们相信自己文字转WAV音频