所以最终还是决定接着此时观察一段再说文字转WAV音频