数据是训练AI能力的“原料”之一。在第八届数字中国建设峰会29日举行的“高质量数据集和数据标注”主题交流活动上,由国家数据局指导的全国数据标准化技术委员会提出,将强化标准引领,分三类建设高质量数据集。
一类为“通识数据集”,包含面向社会公众、无需专业背景即可理解的通用知识,主要用于支撑通用模型落地应用。
一类为“行业通识数据集”,包含面向行业从业人员、需要一定专业背景才能理解的行业领域通用知识,主要用于支撑行业模型落地应用。
一类为“行业专识数据集”,包含面向特定业务场景相关人员、需要较深的专业背景才能理解的行业领域专业知识,主要用于支撑业务场景模型落地应用。
       简单举例,互联网百科、问答等为“通识数据集”;行业研究机构报告等为“行业通识数据集”;医院科室特定疾病病例等为“行业专识数据集”。
       国家数据局相关负责人表示,从发展趋势来看,人工智能模型对数据集的需求正从“通用知识”向“专业知识”延伸拓展,经过专家精细化标注的数据集已成为AI价值实现过程中不可或缺的基石,下一步将积极引导做好高质量数据集和数据标注建设工作,为人工智能技术创新和产业应用提供坚实的数据基础。
       (总台央视记者 丁雅妮 刘柏煊)
       来源:央视新闻客户端
办公地址:四川省广元市利州区东坝办事处利州东路、兴安路康隆·财富旺角6#16-1
邮编:628400 联系电话:0839-3617508
Copyright©2025 广元广财企业服务有限公司 All Rights Reserved
0839-3617508