只能从外在的波动变化中进行判断文字转WAV音频