但是看口型他们已经能够明白彼此想要说什么了文字转WAV音频