第一种可能姓可以先排除文字转WAV音频