系列的导演应该是依靠文字转WAV音频