7月13日,国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局公布《生成式人工智能服务管理暂行办法》,“新规”自2023年8月15日起施行。
博特智能AIGC安全实验室,第一时间组织专家顾问,全面解读“生成式AI新规”的价值意义。此次,“生成式AI新规”的出台,相当于明确了监管的原则底线,给在行业里摸黑航行的企业,提供了一盏灯塔陪伴,对促进行业和技术的发展,具有绝对的正向意义。
总体基调:支持创新鼓励发展
《办法》提出,鼓励生成式人工智能技术在各行业、各领域的创新应用,生成积极健康、向上向善的优质内容,探索优化应用场景,构建应用生态体系。支持行业组织、企业、教育和科研机构、公共文化机构、有关专业机构等在生成式人工智能技术创新、数据资源建设、转化应用、风险防范等方面开展协作。
高频词汇:“数据”、“安全”
人工智能离不开数据、算力和算法,在本次《办法》中,数据是第一高频词,出现次数高达18次,而算力、算法出现次数为3次和6次。数据方面的具体相关措施例如:
推动生成式人工智能基础设施和公共训练数据资源平台建设。
推动公共数据分类分级有序开放,扩展高质量的公共训练数据资源。
鼓励采用安全可信的芯片、软件、工具、算力和数据资源。
生成式人工智能服务提供者(以下称“提供者”)应当依法开展预训练、优化训练等训练数据处理活动,需遵守的规定包括使用具有合法来源的数据和基础模型;采取有效措施提高训练数据质量,增强训练数据的真实性、准确性、客观性、多样性等。
同时,《办法》还对提供者数据标注作出规范(开展数据标注质量评估等),并明确了提供者的责任和义务。
从数据方面来看,AI技术的训练需要巨大数据量的大规模数据集投喂,在这种情况下,AI技术及应用不仅会存在不当使用导致的数据泄露,还面临着提示语注入攻击等数据安全风险。
所以,AIGC实验室认为,未来需要对数据的使用权、所有权、运营权进行确权,并对数据安全的技术发展、应用场景都提出更高要求。值得一提的是,北京市、深圳市等多地政府近日相继发布人工智能支持政策,且均强调了公共数据开放与共享,包括“加快构建高质量人工智能训练数据集,研究建立数据集开放共享机制”、“培育高质量数据要素市场”等。对数据要素市场具有积极意义对引导。
除此之外,“安全”在本次文件中出现频次也达到了14次。
引导方向:推动生成式人工智能基础设施建设
关键词:算法、芯片、软件、工具、算力、数据
《办法》还提出,鼓励生成式人工智能算法、框架、芯片及配套软件平台等基础技术的自主创新,平等互利开展国际交流与合作,参与生成式人工智能相关国际规则制定。推动生成式人工智能基础设施和公共训练数据资源平台建设。促进算力资源协同共享,提升算力资源利用效能。推动公共数据分类分级有序开放,扩展高质量的公共训练数据资源。鼓励采用安全可信的芯片、软件、工具、算力和数据资源。
联合监管 共同服务
《办法》提出,网信、发展改革、教育、科技、工业和信息化、公安、广播电视、新闻出版等部门,依据各自职责依法加强对生成式人工智能服务的管理。
以下是具体条款解读:
第一条:
所依据的法律法规为《中华人民共和国网络安全法》、《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》、《中华人民共和国科学技术进步法》等法律、行政法规,制定本办法。
从上述法规中能看到大部分所涉及的都是和安全相关的法律法规。其中《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》是最近1到2年内办法的新的针对个人信息和数据安全的法律法规。由此也可以看出此次管理办法主要行政监管主要还是依据现行的相关法律法规执行。
第三条:
1、支持创新发展;
2、对生成式人工智能服务实行包容审慎;
3、分类分级监管;
整体理解应该是鼓励支持,只要不是太过分基本可以大胆干,太过分的场景在第四条会有说明。
第四条:
此条突出了几个方面,主要涉及内容安全方面。所涉及的维度包括设政,意识形态,歧视,知识产权。重点突出了社会主义核心价值观,也就是意识形态方面的内容安全问题。
第五条:
鼓励生成式人工智能在各个领域的创新,支持企业参与风险方面的防范。这对于做AIGC内容安全的公司来讲是比较好的机会。
第六条:
提到公共训练数据资源平台建设。这块之前国内没有相关的资源和趋势。估计后面相关的企业和政府会组建开放的数据训练资源平台供大模型去训练和使用。
第七条:
整体还是依据《个人信息保护法》相关的规定来监管。
第八条:
主要对数据标注提到了相关的监管和要求。因为数据标注决定了最后输出什么样的内容,这块整体还是要满足第四条所避免的内容。
第九条,第十条:
谁提供谁负责,需要有对未成年人的防护措施
第十一条:
提供者需要对用户个人信息做完全的安全防护措施,不能私自留存用户数据
第十四条:
提供者需要有监管和发现措施,对于发现违法的信息需要及时处置。对于使用者需要有监管义务,不得从事违法活动。
第十七条:
需要做安全评估和算法备案
第十九条:
需要配合监管执法
第二十条:
境外提供的相关aigc产品需要满足社会主义核心价值观。大概率chatgpt不能用了,除非像苹果一样弄个云上贵州来存储国内数据,训练数据满足国内的法律法规。