观点｜梁正：推动高质量数据建设，助力人工智能健康发展

　　日前，国务院印发《关于增强数字当局建立的引导看法》，就主动顺应经济社会数字化转型趋向，充裕开释数字化开展盈利，全面创始数字当局建立新局面作出布置。

　　数字化转型是主流趋向，数字当局建立也是当前的重点范畴。数据是数字化转型的条件和根本，然而我们今朝的海量数据信息还存在数据积聚少、数据尺度没有同一、数据质量参差没有齐、数据开放运用划定规矩没有清楚等突出题目。若何推进高质量数据建立，助力人工智能健康发展？清华大学大众管理学院传授、清华大学人工智能国际管理研讨院副院长、人工智能管理研讨中心主任梁正受新华网思客约请，盘绕这一话题睁开深入探讨。

　　清华大学大众管理学院传授、清华大学人工智能国际管理研讨院副院长、人工智能管理研讨中心主任

　　伴随着数字化海潮的赓续推动，数字化、智能化成为引领将来经济的主要动力。党中央高度重视进步数字经济，国度“十四五”计划和2035年远景目的纲领作出数字化进步战略，安排了数字经济、数字社会、数字当局建立目的。数字经济已成为全球经济社会进步的主要驱动力。而人工智能作为新一轮高新科技革命和工业变更的主要驱动力气，正深刻影响着经济社会的进步历程。

　　人工智能的开展还存在不成熟的处所，当前谈得最多的是不时提拔人工智能技术的安全性、可靠性和可控性，但最主要的是要把AI的赋能作用和工业开展结合起来，让AI成为新基建的一部分，打造数字新基建，行使信息技术推进工业数字化转型。

　　现阶段推进家当数字化转型还需要处理几个题目，一是我们正在许多家当范畴没有数据积聚，德国的许多企业正在20年前就已保留着生产过程相干的各种数据文本，档案很齐，可是我们正在许多行业范畴全是以心传心，欠缺数据记载。二是数据尺度没有同一，质量没有高，包孕我们正在大众范畴的数据，正在一些数字化走得比拟靠前的乡村，比方上海、杭州、深圳等，还仍旧存正在数据尺度和花样没有同一，数据归集难度大的题目。三是数据开放利用规矩没有清楚，这又涉及到管理题目。

　　这层面要注意一个误区，并不是处理了这一些题目后，就一定会发挥作用。就像我们建了良多机场，没有飞机，没有搭客，它能发生效益吗？所以数字基建关键是要跟家产使用联合，不论是大众需求还家产需求。

　　正在家当数字化层面如今相干部分也是有一些共性技能的支撑。比方，我们的机床行业是一个大而散的行业，几近能够笼盖制作业的所有行业，小到螺丝钉、大到高铁、飞机、船舶、火箭，其产物以致设备的制作皆离不开机床。

　　我们曩昔的机床行业总体上是比力落后的，虽有“十八罗汉厂”那样的骨干企业，但是在智能化转型中，我们的企业和德国、日本、瑞士一些抢先的机床厂家相比，竞争力仍是不敷的，所以就致使全部机床行业比力聚集，龙头企业的实力不敷强。

　　而伴随着中国经济体量和市场规模的扩大、出产制作的需求，企业中数控机床的数目正在不休爬升。数控机床的发展需求比较好的数字化根蒂根基，如今中国机床东西工业协会正正在探索推进一项立异性的智能化办事，用工业云的体例收集聚集正在各个企业、机床上的数据，经由数据整合、进修对工艺参数等优化后再分发给企业。这有点像正在机床范畴建了个安卓体系，按期优化升级，能够大大提高工业出产率。

　　越是传统的行业，实在干数字化、智能化空间越大。例如已往农业服从很低，正在收集、贮存、畅通环节都邑发生大批华侈，现阶段经过聪明农业、数字农业建立，加了农业附加值。正在这里层面数字财产园是个很好的实验，行使能够开放的大众数据，吸引相干财产会聚，行使优良资源，推进企业数字化、智能化进展和财产会萃。智能化转型将来是一个必定，我们的财产进展有很大远景，现阶段中国经济面对“三重压力”，实现数字化和智能化转型，就可以激起数字经济进展新动能。

　　“人工智能有几许智能就有几许人工”，这虽然是句讥讽的玩笑话，但阐明人工智能还存正在许多题目。例如自动驾驶还没法完整离开人的操控，练习算法所需的场景数据仍需要人来标注。只管机械具有了自我进修的才能，但正在很大程度上仍需要人来引诱，正在操纵大批的数据练习后才能展现出一些结果。正在如许的靠山下，借使倘使标注者本身的学历和才能犬牙交错，那人工智能自我进修的结果还大不相同，如许的情形正在医疗、修建这类专业性较强的行业更加突出。假如我们等待以如许的方法推进工业行业的高质量数据建立，正在我看来这是不太可能的。

　　推进高质量数据建立，究竟该怎么做？现阶段正在多个中央已发生一些有益实验。比方深圳龙岗建了一个AI小镇，依照数字化、智能化工业生长所需求的资源对AI小镇的底层架构开展系统化设置，比方一些公共部门的数据，正在聚集和收拾整顿后先面向社会开放运用。

　　今朝全国曾经有约15个省市区出台了数据方面的管理条例或地方性政策，这是正在中心鼎力推进下获得的进度。不论是数字经济照旧人工智能试验区，像深圳那样的中国特色社会主义先行示范区要勇干“排头兵”，积极探索数据要素范畴的产权制度、大众数据开放、流畅生意业务和数据安全等管理机制。

　　当代社会中的数据宁静题目，特别是一些场景下公允题目尤其突出，相干顶层设计的重要性还愈发凸显。例如数据宁静触及个人财产，这种题目的管理难度非常大。另外还有伦理范例方面的题目，正在数据宁静范畴，我们该若何把控伦理的底线，这一些都对我们的事情提出宏大挑衅。2021年，欧盟公布了《人工智能法》草案，虽然今朝仍正在征集定见中，但这是环球范围内关于人工智能的首部系统化执法，还就算是正在这里方面的一大打破。

　　自2021年11月1日起，我国还最先实施《中华人民共和国小我信息保护法》，这部功令取《数据宁静法》等其他几部功令配合构成了我国数据宁静底线管理的根本。特别是医疗、金融、司法那样一些涉及到小我权益以致人身宁静的主要行业，使用相干算法举行自动化决议计划要十分当心。正如前文所说，这一些行业内主流的机械训练方法，不具备可解释性，只是一个数据拟合的后果，是以存在堕落几率。

　　我以为，算法应用要符合伦理，要保障底线、公正且掩护隐私，不能够侵占小我私家权益。特别是在一些小我私家范畴，针对相干算法民众要有问责权，针对宁静主体义务要按期审查，必要时应思索引入第三方的宁静评价轨制。针对一些数据缘由形成的决议计划毛病，我们还应引入人工干预纠偏并复核。是以，由底层手艺的角度来看，终极我们需求确立的是一个综合性的人工智能管理体系。

　　数据是数字化转型的条件和根底，这个数据既包含大众数据，还包含平台企业所控制的消费者小我数据，所以在经管、运用、流动上情势是不一样的，相应的轨制和经管机制设计还应各有不同。

　　总的来看，关于人工智能治理，一是技能自己要可解释可控，二是有时可能要人工干预，这是一个多元协同治理的观点。当前我国针对人工智能特定运用场景曾经出台了治理步伐，如《互联网信息效劳算法推举治理划定》。将来应从算法分级分类治理的角度动身，根据高风险高危害、高风险低危害、低风险高危害、低风险低危害分别，针对差别行业、差别场景下的运用采纳差别的治理东西组合。

　　人工智能管理题目是正在高速进展中泛起的题目，所以我们将其归结为新兴手艺的管理，适用于“矫捷管理”的观点。对它要有一个客观的立场，不可以视其为毒蛇猛兽，还不可以放任不管，反而是要密切地往相识其进度，然后引入相干好处方，凭据它的进展演化，持续地往调适管理形式、立异管理手腕。

参考资料