首先要像顾哥说的那样在前期就要定位准确文字转WAV音频