

吴桂德
北京航空航天大学法学院副教授,法学博士、博士后
文章导读
摘要:
大数据与数字经济背景下构成大模型基础的数据既具有无形、海量、秘密性、价值性与可支配等特征,又能通过人工智能算法技术转换为商业利益。就此,我国倡导可商业化利用数据的流通与共享,并结合不同应用场景开展分层分类保护的实践探索,特别是有关数据确权的学理讨论此起彼伏。但基于交易激励之数据访问权的相关学理探讨明显不足,实务中也常因可否合理访问、使用数据问题而引发纠纷。故而,本文认为在认可大型数据企业控制数据的事实前提下,摒弃在数据生产环节过多防御性赋权保护的理论臆想。同时,秉持技术中立、FRAND许可、多重保护等原则,通过人工智能大模型背景下现有私法框架内对数据权益分阶段、分类分层间接保护的梳理以及比较法上的反思,主张在数据流通环节展开数据访问权的私法构造,以期助力数据的积极访问、交易以及权益保护。
· 目录:
一、问题的提出
01
问题的提出
数据既是人工智能技术的重要组成部分,更是诸多网络服务、加工包装、产品销售、物流等的关键生产要素;例如通过对数据的规模化采集与处理加工,可帮助企业实现精准定向推销、改善产品的市场欢迎度、提升产品和服务的质量等目的。利用该技术发展新的和具有创新性的数据服务、产品的能力是企业重要的竞争方向。2023年8月15日,我国《生成式人工智能服务管理暂行办法》(以下简称《人工智能办法》)正式实施,旨在将生成式人工智能技术纳入法治化管理模式。生成式人工智能又以“输入—处理(学习)—输出”的数据大模型为依托,需要通过海量的数据就不同应用场景进行训练,从而满足相应数字产品与服务的需求。一方面,与传统生产要素的绝对排他不同,数据要素因具有非竞争性可由多个主体重复使用,且不存在边际收益递减问题,即数据(集)的价值随着广泛应用反而会增加。因此,其开放共享能促进整体经济效率和实现生产要素的升值。另一方面也存在海量数据利用过程中的侵权风险,且所涉及的侵权问题通常较为隐秘、复杂与泛化,特别是有关知识产权保护问题尤为明显。出于厌恶风险的心理,许多大型数据企业往往倾向于人为构筑技术屏障,以保护、垄断自身持有的数据集合之财产性利益,从而影响开放创新。故此,当前实务中数据大规模商业化利用的合法性与合理使用问题愈发凸显,亟需结合当前以大模型驱动的人工智能之技术现状而寻求合理的法律指引。
02
逻辑前提:以控制权为基础的数据私法保护制度搭建及其演变
(一)可商业化利用数据的有限排他性保护需求及其因应
一方面,我国《民法典》第127条规定,“法律对数据、网络虚拟财产的保护有规定的,依照其规定。”该条在现行法上为数据作为私法权益客体的法律保护与路径展开奠定了逻辑基础。同时,可商业化利用数据不论是数据收集的方式还是集合而成的独特结构方式或多或少都具有知识产权维度的独创性,而且这些具有商业价值并可市场化经营的数据通常需要分层分类保护。加之,基于洛克的劳动财产理论,数据收集者出于其劳动所凝结而成的财产利益而获得法律保护。另一方面,作为劳动成果的数据集合只有在流通利用中才能实现其增值与赋能经济的目的。从私法权益的“分配层次理论”维度考量,过度的赋权保护则容易阻碍数据自由交易市场的形成和窒碍数据产业的发展;还容易形成数据垄断状态,甚至因有些头部数据企业的垄断行为而导致“数据孤岛”现象的产生,进而抑制相关市场的创新。故此,传统完全排他的财产权保护不适合人工智能大模型技术背景下大量抓取数据的商业实践,更为合适的是在“有限排他性保护需求”的基础上,作为特殊权益(sui genris)的数据多层综合保护模式,例如复合型且相对弱化的数据权益私法化整合保护。
03
私法框架下基于交易之数据访问权的确立与体系展开
(一)数据访问权在数据商业化利用过程中的功能定位及其构造之必要
数据访问权在功能上通常被视为是缓解“数据孤岛”现象的一种制度手段,以便需求者能够“解锁数据”。如前所述,有学者倡议在法律上赋予相关权利主体以“数据产权”等财产权化的方式,以实现对数据在市场经济活动中的占有、使用、收益与处分等物权性权益的强保护。但该方案仅停留在理论构想阶段,实践基础并不扎实,且存在明显的数据界权成本问题。其后,有学者经由权利束维度的多重权益考量,并基于效率原则和对数据财产权论的修正,主张尊重权利人对数据的事实控制,创设有利于竞争且能相对控制数据使用权的权属。即实现数据单一财产权路径保护至多重权益保护之数据控制权进路的转变。然而,二者都容易导致数据垄断问题,且该问题在人工智能技术加持下将更为突出。就此,有必要基于数据特殊权益的多重私权属性,通过构建数据访问权之制度激励打破信息孤岛、盘活数据存量,从而更好地访问和利用数据(集)。
04
FRAND原则视域下人工智能大模型创新中的数据共享与权益保护并举
我国现已正式实施《民法典》《个人信息保护法》《数据安全法》《人工智能办法》《互联网信息服务深度合成管理规定》等法律法规,为人工智能大模型技术背景下数据的商业化利用提供了制度基础保障。即便如此,由于技术业态的迅速发展且涉数据的有关纠纷复杂,无论是现行法本身还是在其解释与适用方面仍有较大的改善空间。实践中,个人与小微企业财产权(益)保护具有促进(社会)自治和市场创新的特征,但正是由于行业内许多大企业的共同存在,才帮助和促进了该行业内中小企业的发展。即,小的生产单位若想取得成功,在很大程度上要依赖于在产业图景中的一家或多家大企业。如此产业内大小企业既相互独立又相互依存的纽带关系在当前大数据产业中亦然。人工智能企业创新的前提是大规模数据流通与共享,因此需要打破现有数据企业间的“数据壁垒”,以避免大型数字平台的“锁定效应(locked in)”与市场失灵。同时,应当转换思路,从更为积极与高效地激励数据接触与流动维度思考问题,即在尊重现有规则的前提下,考虑如何通过适当的制度整合与改良而更有效地利用数据集合。譬如,在数据大规模共享、访问的具体收费标准构建方面借鉴适用源自专利法上现有“公平、合理、无歧视(Fair,Reasonable,andNon-Discriminatory,FRAND)”的授权许可规则,从而有利于降低交易成本和提高市场效率。
05
余论:警惕权利泛化、激励数据共享
数字经济时代,数据生产者、控制者往往因经济利益倾向于垄断数据并阻碍数据要素的流通,因而有关数据商业化利用规则的不确定性首先会影响到各行业内作为需求方的中小微企业。数据驱动的创新也因此受到阻碍,从而不仅提高了市场信息成本与准入门槛,也降低了现有市场的可竞争性。这显然与我国的国家政策要旨相悖。笔者认为,有必要以当前人工智能数据大模型发展为契机,基于可商业化利用数据多重私权属性与有限排他性的保护需求,在私法框架内坚持技术中立、FRAND许可、多重保护等原则下,主张数据的积极访问、有效流通与权益保护同步。在不轻易变革现有信息系统、规范制度与数据资源控制权以及管理格局的前提下,明晰责权利,适当提高侵权门槛,以最小成本促进数据要素资源高效共享和利用。