只能搜集表面消息文字转WAV音频