他觉得自己应该表现的好像一个正常人文字转WAV音频