看来他掌握着文字转WAV音频