从最细微的分子层面开始结合文字转WAV音频