因为这本书的整体构架早就已经完善了文字转WAV音频