一是归纳了可信Al发展变迁的产业技术背景,即近期算法、算力、数据基础不断夯实,人工智能固有技术风险持续放大,可信AI技术成为AI领域关键底层能力,各国也正在围绕生成式人工智能监管、人工智能伦理等推动治理。
二是梳理了现阶段可信Al四大技术方向发展情况。可信AI已在行业领域落实成具体产品和实践案例,总体上正从创新整合解决方案阶段迈向形成可信系统机制的阶段,完整的实践链路、健全的标准和系统机制将逐步落地。
三是概括了面向大模型和AIGC的可信Al探索,即大模型时代下可能面临的安全可信挑战,主要包括大模型的生成式攻击和防御、大模型自身的安全风险和隐患、大模型的可解释性和公平性问题等三大类。
四是构建了以技术为保障的可信Al评估体系,面向产业发展需求,构建了包括隐私保护检测、可解释性检测、公平性检测和鲁棒性检测的可信AI检测指标体系,并提出了具体的评估内容、指标和方式,并可进一步赋能大模型与AIGC发展。
最后,本白皮书从技术、产业、生态和监管维度对可信人工智能发展提出了建议,对趋势进行了展望,将迎来研究应用更加均衡、内在动力更加多维、外在监管更加全面的发展局面。
你可能感兴趣