这一方面他都是自学的文字转WAV音频