因为他自己一开始的目标就十分明确文字转WAV音频