两个核心……单单谁做主文字转WAV音频