这个时候自己应该是先去报道文字转WAV音频