生成式AI“狂飙”背后合规问题亟待引起重视
今年1月,OpenAI公司发布的ChatGPT仅推出两个月后,月活跃用户数达1亿,不仅引发舆论热潮,也掀起新一轮“军备竞赛”。此后,多家公司陆续发布生成式人工智能应用。据了解,目前国内也有十几家企业布局该领域。
除了投资训练生成式人工智能产品,一些企业还提供ChatGPT接入服务,大量人工智能生成内容也开始应用于工作生活。记者采访了解到,无论提供还是使用该类服务,都隐藏着不少法律风险。
AIGC训练面临多重合规问题
据了解,ChatGPT属于生成式人工智能(AIGC),其技术本质上是大型语言模型应用,需要利用超大规模数据集进行训练。公开资料显示,2020年6月,OpenAI的GPT-3达到1750亿参数的规模。2021年1月,谷歌大脑推出的超级模型已达万亿参数规模。如此大规模数据的使用,潜在的法律风险不容小觑。
北京盈科(重庆)律师事务所高级合伙人律师刘智介绍说,生成式人工智能发展的基础是对海量数据进行处理,目前我国对数据处理行为进行规范的法律是数据安全法和个人信息保护法。提供生成式人工智能训练或提供服务可能存在个人信息、商业秘密在内的数据泄露或著作权侵权等各种风险,甚至面临违反社会公德和伦理的风险。
“在现有法律框架下,生成式人工智能面临包括个人信息、内容合规、著作权、数据权、算法合规在内的诸多法律风险。”汉坤律师事务所合伙人段志超表示。
华商律师事务所高级合伙人文婷对关注度较高的数据来源合法性问题和著作权问题进行了详细阐释。
她介绍说,纳入训练集的数据如果来源于已经合法公开的信息,则法律风险相对较少。但对涉及个人信息的数据,即便已合法公开,仍需注意个人是否明确表示拒绝抓取、存储、使用或以其他方式处理其信息。如果已明确拒绝,则不可将其个人信息纳入训练集。如果收集或以其他方式处理该类信息对个人权益有重大影响,也不能纳入。
如果该类数据不是来源于公开信息,则需要关注收集的目的、方式以及是否获得信息主体合法有效的授权等。“若未按照法律规定收集该等数据,可能面临行政处罚甚至侵犯公民个人信息罪的刑事法律风险。”文婷表示。
“若文本数据挖掘涉及到他人享有著作权的内容,而且未获得作者的授权并支付报酬,则涉及著作权侵权的法律风险。”据文婷介绍,著作权法第二十四条规定了十三种可合理使用他人作品(可不经授权、不支付报酬)的情形,但并未将生成式人工智能中的“数据挖掘”纳入到合理使用的范围。
提供接入服务存在法律风险
目前,互联网上已经出现了很多GPT国内入口,提供在线服务。
刘智告诉记者,ChatGPT因没有通过审查在我国不能提供服务。《工业和信息化部关于清理规范互联网网络接入服务市场的通知》明确规定,未经电信主管部门批准,不得自行建立或租用专线(含虚拟专用网络VPN)等其他信道开展跨境经营活动。“事实上,企业未经许可提供VPN专线服务被追究行政或刑事责任的案例很多。”她提示说。
段志超表示,类似ChatGPT的境外生成式人工智能产品在完成包括《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》以及《互联网信息服务算法推荐管理规定》在内的安全评估和算法备案之前,在向公众服务时都会存在合规风险。
“一本正经地胡说八道”,人工智能产品经常输出虚假信息的问题已被众多网友吐槽。
“若用户因为信赖输出的错误信息或者误导性内容而遭受损失,则服务提供方可能涉及民事赔偿的法律风险。”文婷告诉记者,如果服务被犯罪分子利用或作为诈骗等犯罪工具,导致违法或不良信息广泛传播,服务提供方还可能涉及被行政处罚甚至刑事犯罪的法律风险。
著作权归属尚未达成共识
“用户在和生成式AI的交互中可能会提供涉密信息。相关信息可能被AI模型作为训练素材,在向其他用户提供服务时以一定的形式作为‘回答’输出,导致泄密。”段志超说。
文婷提醒,使用者如果在提问或其他生成式人工智能使用环节违规披露权利人商业秘密,涉嫌侵犯商业秘密,可能需要承担民事赔偿甚至刑事追责的法律风险。
随着深度学习的不断迭代,AIGC百花齐放,产出效果已经逐渐逼真接近人类作品。那么,使用该类作品有无著作权问题?
据了解,我国法院对AIGC是否属于著作权法下的作品观点不一。深圳南山法院曾有相关判决认定了某类软件自动运行产生的产品可获得著作权保护,北京互联网法院以及北京知识产权法院在菲林诉百度案中否认了软件自动生成作品的著作权。
“在现有法律监管体系下,人工智能生成的产品是否具有著作权主要取决于其中自然人对相关生成产品的独创性的贡献。此时,第三方使用相关作品时应符合著作权法的相关规定,包括标注相应的权利方。”段志超表示。
文婷特别提示,“翻墙”使用ChatGPT存在法律风险。“这不仅涉及行政违规问题,还涉及数据及个人信息非法出境问题。”她说。
来源:法治参考