但是也只是口头之言文字转WAV音频