数据是大模型时代的“教材”,其质量影响大模型的训练效率和质量,是大模型智能的天花板。如果要构建高质量大模型,需要什么类型的数据?如何合成新数据?如何配比训练数据?如何合理编排数据?欢迎大家各抒己见