两者之间可以说是有一定的共通点的文字转WAV音频