

吴桂德
北京航空航天大学法学院副教授,法学博士、博士后
文章导读
摘要:
大数据与数字经济背景下构成大模型基础的数据既具有无形、海量、秘密性、价值性与可支配等特征,又能通过人工智能算法技术转换为商业利益。就此,我国倡导可商业化利用数据的流通与共享,并结合不同应用场景开展分层分类保护的实践探索,特别是有关数据确权的学理讨论此起彼伏。但基于交易激励之数据访问权的相关学理探讨明显不足,实务中也常因可否合理访问、使用数据问题而引发纠纷。故而,本文认为在认可大型数据企业控制数据的事实前提下,摒弃在数据生产环节过多防御性赋权保护的理论臆想。同时,秉持技术中立、FRAND许可、多重保护等原则,通过人工智能大模型背景下现有私法框架内对数据权益分阶段、分类分层间接保护的梳理以及比较法上的反思,主张在数据流通环节展开数据访问权的私法构造,以期助力数据的积极访问、交易以及权益保护。
· 目录:
一、问题的提出
01
问题的提出
数据既是人工智能技术的重要组成部分,更是诸多网络服务、加工包装、产品销售、物流等的关键生产要素;例如通过对数据的规模化采集与处理加工,可帮助企业实现精准定向推销、改善产品的市场欢迎度、提升产品和服务的质量等目的。利用该技术发展新的和具有创新性的数据服务、产品的能力是企业重要的竞争方向。2023年8月15日,我国《生成式人工智能服务管理暂行办法》(以下简称《人工智能办法》)正式实施,旨在将生成式人工智能技术纳入法治化管理模式。生成式人工智能又以“输入—处理(学习)—输出”的数据大模型为依托,需要通过海量的数据就不同应用场景进行训练,从而满足相应数字产品与服务的需求。一方面,与传统生产要素的绝对排他不同,数据要素因具有非竞争性可由多个主体重复使用,且不存在边际收益递减问题,即数据(集)的价值随着广泛应用反而会增加。因此,其开放共享能促进整体经济效率和实现生产要素的升值。另一方面也存在海量数据利用过程中的侵权风险,且所涉及的侵权问题通常较为隐秘、复杂与泛化,特别是有关知识产权保护问题尤为明显。出于厌恶风险的心理,许多大型数据企业往往倾向于人为构筑技术屏障,以保护、垄断自身持有的数据集合之财产性利益,从而影响开放创新。故此,当前实务中数据大规模商业化利用的合法性与合理使用问题愈发凸显,亟需结合当前以大模型驱动的人工智能之技术现状而寻求合理的法律指引。
02
逻辑前提:以控制权为基础的数据私法保护制度搭建及其演变
(一)可商业化利用数据的有限排他性保护需求及其因应
一方面,我国《民法典》第127条规定,“法律对数据、网络虚拟财产的保护有规定的,依照其规定。”该条在现行法上为数据作为私法权益客体的法律保护与路径展开奠定了逻辑基础。同时,可商业化利用数据不论是数据收集的方式还是集合而成的独特结构方式或多或少都具有知识产权维度的独创性,而且这些具有商业价值并可市场化经营的数据通常需要分层分类保护。加之,基于洛克的劳动财产理论,数据收集者出于其劳动所凝结而成的财产利益而获得法律保护。另一方面,作为劳动成果的数据集合只有在流通利用中才能实现其增值与赋能经济的目的。从私法权益的“分配层次理论”维度考量,过度的赋权保护则容易阻碍数据自由交易市场的形成和窒碍数据产业的发展;还容易形成数据垄断状态,甚至因有些头部数据企业的垄断行为而导致“数据孤岛”现象的产生,进而抑制相关市场的创新。故此,传统完全排他的财产权保护不适合人工智能大模型技术背景下大量抓取数据的商业实践,更为合适的是在“有限排他性保护需求”的基础上,作为特殊权益(sui genris)的数据多层综合保护模式,例如复合型且相对弱化的数据权益私法化整合保护。