China Behavioral Law Society Development Network

中国行为法学会事业发展网
  • 中国行为法学会第六届四次理事会在京召开
  • 沉痛悼念马宝善同志
  • 中国行为法学会医疗健康法治研究专业委员会战略合作研讨会在京召开
  • 学会动态 | 第二届“澜沧江—湄公河次区域”国际法治论坛在云南警官学院举行
  • [完整版|图文]《中国法治实施报告(2022)》隆重发布
  • 《企业商事刑事风险防范指引丛书》 启动交流会在京召开
  • 中国行为法学会侦查学专业委员会第十四届全国侦查学术研讨会暨第七届现代侦查技战法论坛在浙江绍兴召开
  • 《民营经济促进法(草案)》征求意见座谈会在长沙举行
  • 为人民抒怀、为时代放歌 《人民就是江山》——大型公益原创歌曲交响 音乐会在京举办

   时政要闻

法治研究 | 吴桂德:人工智能大模型背景下数据访问权的私法构造

来源:中央纪委国家监委网站 | 作者:管理员 | 发布时间 :2026-03-19 14:20:09 | 17 次浏览: | 🔊 点击朗读正文 ❚❚ | 分享到:

图片

图片

吴桂德

北京航空航天大学法学院副教授,法学博士、博士后

文章导读

摘要:

大数据与数字经济背景下构成大模型基础的数据既具有无形、海量、秘密性、价值性与可支配等特征,又能通过人工智能算法技术转换为商业利益。就此,我国倡导可商业化利用数据的流通与共享,并结合不同应用场景开展分层分类保护的实践探索,特别是有关数据确权的学理讨论此起彼伏。但基于交易激励之数据访问权的相关学理探讨明显不足,实务中也常因可否合理访问、使用数据问题而引发纠纷。故而,本文认为在认可大型数据企业控制数据的事实前提下,摒弃在数据生产环节过多防御性赋权保护的理论臆想。同时,秉持技术中立、FRAND许可、多重保护等原则,通过人工智能大模型背景下现有私法框架内对数据权益分阶段、分类分层间接保护的梳理以及比较法上的反思,主张在数据流通环节展开数据访问权的私法构造,以期助力数据的积极访问、交易以及权益保护。

· 目录:

一、问题的提出

二、逻辑前提:以控制权为基础的数据私法保护制度搭建及其演变
(一)可商业化利用数据的有限排他性保护需求及其因应
(二)数据新型财产权直接赋权保护的批判与反思
(三)作为替代选项之数据控制权的形成及其局限
(四)衍生自数据控制权之数据访问权的正当性基础初探
(五)小结
三、私法框架下基于交易之数据访问权的确立与体系展开
(一)数据访问权在数据商业化利用过程中的功能定位及其构造之必要
(二)数据访问权私法构造在人工智能大模型技术场景中的具体展开
四、FRAND原则视域下人工智能大模型创新中的数据共享与权益保护并举
(一)从行政主导到市场导向之人工智能数据治理的利益平衡实现
(二)秉持FRAND原则之于数据访问权实施的正当与必要
(三)FRAND原则在人工智能数据大模型访问场景中的具体展开
五、余论:警惕权利泛化、激励数据共享

01

问题的提出

数据既是人工智能技术的重要组成部分,更是诸多网络服务、加工包装、产品销售、物流等的关键生产要素;例如通过对数据的规模化采集与处理加工,可帮助企业实现精准定向推销、改善产品的市场欢迎度、提升产品和服务的质量等目的。利用该技术发展新的和具有创新性的数据服务、产品的能力是企业重要的竞争方向。2023年8月15日,我国《生成式人工智能服务管理暂行办法》(以下简称《人工智能办法》)正式实施,旨在将生成式人工智能技术纳入法治化管理模式。生成式人工智能又以“输入—处理(学习)—输出”的数据大模型为依托,需要通过海量的数据就不同应用场景进行训练,从而满足相应数字产品与服务的需求。一方面,与传统生产要素的绝对排他不同,数据要素因具有非竞争性可由多个主体重复使用,且不存在边际收益递减问题,即数据(集)的价值随着广泛应用反而会增加。因此,其开放共享能促进整体经济效率和实现生产要素的升值。另一方面也存在海量数据利用过程中的侵权风险,且所涉及的侵权问题通常较为隐秘、复杂与泛化,特别是有关知识产权保护问题尤为明显。出于厌恶风险的心理,许多大型数据企业往往倾向于人为构筑技术屏障,以保护、垄断自身持有的数据集合之财产性利益,从而影响开放创新。故此,当前实务中数据大规模商业化利用的合法性与合理使用问题愈发凸显,亟需结合当前以大模型驱动的人工智能之技术现状而寻求合理的法律指引。

随着目前人工智能技术应用逐步纳入国家法治化治理框架,有关数据赋权的学理讨论与实践探索愈来愈受关注。2024年10月9日,我国发布《关于加快公共数据资源开发利用的意见》,形成有关数据治理的国家政策注重与学界讨论关注之“双向奔赴”局面。特别是为推动企业间的数据共享,释放私营部门的数据潜力,各界对有关数据商业化利用与访问的议题讨论尤为重视。就此,无法避免的问题是,何为数据访问权?其正当性基础何在?以及如何确保人工智能创新中合理、充沛的数据资源的访问与利用,何种法律框架适合激励数据市场的自由交易与流通共享?故此,有必要基于当前人工智能大模型发展的技术背景和可交易数据的私权属性,从私法维度出发探讨我国法上有关积极性权利之数据访问权(Zugangsrecht)的法律意涵、学理基础及其具体构造,以期促进数据流通共享与赋能我国数字经济稳健发展。

02

逻辑前提:以控制权为基础的数据私法保护制度搭建及其演变

(一)可商业化利用数据的有限排他性保护需求及其因应

一方面,我国《民法典》第127条规定,“法律对数据、网络虚拟财产的保护有规定的,依照其规定。”该条在现行法上为数据作为私法权益客体的法律保护与路径展开奠定了逻辑基础。同时,可商业化利用数据不论是数据收集的方式还是集合而成的独特结构方式或多或少都具有知识产权维度的独创性,而且这些具有商业价值并可市场化经营的数据通常需要分层分类保护。加之,基于洛克的劳动财产理论,数据收集者出于其劳动所凝结而成的财产利益而获得法律保护。另一方面,作为劳动成果的数据集合只有在流通利用中才能实现其增值与赋能经济的目的。从私法权益的“分配层次理论”维度考量,过度的赋权保护则容易阻碍数据自由交易市场的形成和窒碍数据产业的发展;还容易形成数据垄断状态,甚至因有些头部数据企业的垄断行为而导致“数据孤岛”现象的产生,进而抑制相关市场的创新。故此,传统完全排他的财产权保护不适合人工智能大模型技术背景下大量抓取数据的商业实践,更为合适的是在“有限排他性保护需求”的基础上,作为特殊权益(sui genris)的数据多层综合保护模式,例如复合型且相对弱化的数据权益私法化整合保护。

(二)数据新型财产权直接赋权保护的批判与反思
如前所述,基于数据的特殊私权益保护需求,目前数据财产化径直赋权保护的学理呼声不断。一方面有研究者主张选择“创新之路”,比如基于数据所体现的与知识产权的“近亲属”关系,将其对标现有知识产权制度,即作为一项“新型知识产权客体”而独立赋权的提法。另一方面也有学者主张走“中间道路”,寻求例如介于民法和知识产权法之间的所谓“数据新型财产权”保护。当然,无论何种权利保护模式都是基于数据生产环节数据持有者的立场对数据权益直接赋权式的保护与理论建构,而常常忽略在数据流通环节基于数据使用者维度对数据的合法利用行为进行间接激励。随着人工智能技术的广泛使用和法律上对反向工程的普遍允许,数据抓取、分析技术的运用并不被认为是一种非法的获取手段,特别是如果使用的是处于公有领域的数据。因而有必要抛开仅局限于生产环节数据界权的逻辑思维,从而考虑流通环节数据使用权的适当构建。尤其是人工智能大模型训练需要大规模抓取与利用数据,而相对固化的财产权保护存在人为排他的风险,恰构成对该技术样态发展与创新的阻碍。
诚然,一方面数字经济时代的新技术、新模式、新业态层出不穷,另一方面法律规范的变革又时常滞后甚至缺位,因而很有可能出现法律漏洞的情形。但即便出现法律漏洞,法学方法论维度通常可先通过法解释技术认定该漏洞的种类,再通过例如类推适用、目的性限缩、目的性扩张、创制性的补充等方式进行法律漏洞的填补,进而可先利用法官造法之方式通过法律的续造而务实解决纠纷。新设所谓“数据新型财产权”或者另一套新制度通常是以现行法存在漏洞为前提,需要各方在司法实务中进行长期的利益博弈,进而转化为立法表达,不宜操之过急。由于缺乏实证经验的足够积累,存在新设权利与现行法兼容与否问题,因而为迎合业态发展之“能动立法”的态度应当警惕。
同时,比较法维度欧美等多数发达国家目前并不赞同以财产化赋权的制度变革方式干预本国数字市场发展。譬如,日本立法者认为,虽然通过设立新型财产权对数据赋权是基于现行法保护的一种可能替代方案,但专有权限制性太强会抑制创新,因此目前日本选择了例如依据现行《防止不正当竞争法》的防御策略,即允许“有限访问(提供)数据(shared data with limited access)”;并对通过盗窃、欺诈、胁迫或其他不当方式获取数据集合的行为进行追索,同时最大限度地提高整体数据利用率。该国认为现行法已提供了充分保护无需加强,但还需采取更多灵活步骤以激励数据流通与广泛利用。日本有意放松对人工智能大数据技术研发的监管以及重视对创新样态的制度激励与政策扶持,如此态度也明显反作用于市场行为:比如近年许多美国头部数据企业将其数据存储(托管)中心迁至日本,此举无疑会促进该国日后数字经济的发展。有鉴于此,舍弃数据生产环节的各种理论臆想,基于我国现行法务实探索数据流通环节激励数据交易的间接保护模式,才是人工智能大模型运用背景下数据治理的上策。
(三)作为替代选项之数据控制权的形成及其局限
私有财产、契约(合同)和竞争自由以及作为价格形成基础的有效货币体系是(私)法在创建市场组织时必须保证的基本秩序原则。一个有效的市场竞争环境必须以此为遵循进行塑造与完善。而为了实现数据驱动型市场经济,通常需要对这些基本秩序进行调适,其中,合同自由和竞争对于当前数据市场运行而言必不可少。二者自然也构成了基于占有保护与有限排他之可交易数据控制权权能实现的内在要求。因此,在数据生产环节认可相关权利人对数据集合的控制权不仅是出于维护市场竞争秩序的需要,而且具有激励高质量数据生产的效果。
数据控制权的内涵包括合法权利人对数据的持有、利用、经营与交易等行为的控制。即,从传统民法维度考虑其分别对应于确保在数据(集)之上类似于物权性的占有、使用、收益与处分等权能的实现,以及排除他人就这些权能实现的禁止权(Verbotsrecht)。即使这种相关数据保护法规定的禁止权不能被定性为法律意义上的财产权,但它仍然构成了数据市场的权益基础以及法经济学意义上的所谓“行为权(Handlungsrecht)”,是数据访问权的逻辑前提;因而也是数据持有者例如在合同中就数据集合自由处分的基础。在数据权益保护方面,通常与一般人格权保护对侵权行为作出事后反应(ex post)不同,对可能的数据权益侵害行为应事先预防(ex ante),即所谓“预防原则”。申言之,数据控制权的合法性基础与环境权益保护又或是健康权益保护类似,都是出于人们厌恶风险的心理,是一种因对可能存在的危险了解不全面而选择的事先(风险)预防机制。然而,预防原则的适用往往又不可避免地与过度保护并存,过于严苛地束缚数据的流通和利用,容易抑制数据信息处理者的创新行为,因而需要警惕以及适当的利益平衡。
2022年12月2日出台的《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称《数据二十条》)第7条第4项指出“保护经加工、分析等形成数据或数据衍生产品的经营权,依法依规规范数据处理者许可他人使用数据或数据衍生产品的权利,促进数据要素流通复用”。由此推出,相关数据产品的经营权实则是数据生产者(包括持有者)就其数据产品和所提供服务的使用支配权,本质上仍是对数据的控制权。通常,商业实践中是以作为守门人(The gatekeeper)的大型数据企业(平台)的数据控制权为前提,其对所付出劳动而收集与控制的数据集合基于前述洛克的劳动财产(激励)理论享有应然的财产性利益。在现行法规范层面,这些具有私法上复合型权利客体属性的财产性利益难以用某一单行法达至保护目的,而是需要例如知识产权法、民法、反不正当竞争法等所构成之多重私权的体系性保护。同时,为避免上述因过于事先预防而导致的数据垄断行为,相关数据企业的事实控制行为需要规制,因而有必要围绕数据的(使用)控制权及其具体权能而展开数据访问权的私法构造。
(四)衍生自数据控制权之数据访问权的正当性基础初探
人工智能通常由数据、算法和算力三要素构成。而人工智能大模型技术的智能化之路需要大量数据的“投喂”,特别是需要对高质量数据集合的访问与数据抓取。如前所述,由于利益驱使以及维护自身竞争利益,大型数据企业往往可能滥用支配地位而封锁数据,拒绝行业内新兴企业的准入。进而形成所谓“数字鸿沟”现象,阻碍数据流通,导致市场失灵,抑制数字市场的创新与竞争。为更有效率地配置数据资源,从而促进数据资源的流通、开发与利用,应当在人工智能大模型等新技术的实践运用过程中,尤为重视对市场交易弱势群体之中小微企业的数据访问权保护,有必要赋予抑或明晰其相关权益。如此既符合我国当前数字经济整体产业转型升级的现实需求,也具有学理上的正当性,并能较好地协调技术创新和市场主体间的权益平衡。
一方面,从现有规范制度维度考量,通过特定技术手段的界分和控制,作为市场交易客体且可商业化利用的数据(集)在法律上通常是作为一种市场交易关系中的客体对待,从而为平等法律关系主体之自然人、法人与非法人组织服务。目前我国学界也较为认可其属于私法上的权益客体。同时,基于数据集合的无形性及其具有独创性的收集方式、数字存储结构考虑,可参与市场交易之数据自然与同样无形的知识产权客体之间存在“近亲属”关系,故而在实务断案中的制度选择方面常常将之与现行的知识产权制度相衔接。新近有国外研究者指出,数据访问权与知识产权以及商业秘密保护制度基本上相互兼容,仅在制度之间具体如何衔接方面还需进一步完善。特别是部分具有独创性的人工智能生成之数字内容当然可作为知识产权维度的数据产品加以保护。因此,知识产权及其相关制度在人工智能大模型背景下数据访问权的私法保护中必将起到重要作用。
另一方面,须明确的是,数据访问权的确立是目前实务产业现状与技术发展的需要使然,进而反馈于具体的规则设计需求。譬如,我国法院就是否因技术性要素参入而考量赋予当事人数据访问权的正当性时指出,只要是无需访问权限即可访问的平台公开数据,无论是通过用户浏览还是网络爬虫技术抓取,其行为本质无异;因而不应将用户浏览和遵守通用技术规则的网络爬虫等智能化程序访问与抓取数据的行为区别对待。据此可知,我国司法实务中法官秉持技术中立的原则以促产业和技术发展的司法态度值得肯定。另外,以知识产权的数字化应对为着眼点,有研究者从集体创造性维度指出,数字时代最好的知识产权政策要旨在于通过实行某种最低限度干涉的知识产权政策,从而促成由广泛的可获得性与网络效应之内在逻辑所驱动的数字媒体,以实现知识产权鼓励创新与增进社会福祉的制度目标。即数字时代通过依托集体的智慧不断实现社会整体福利最大化仍是各项规则与权益保护完善的目的。这在大模型背景下数据访问权私法保护路径选择的价值衡量上亦然。
再者,需明确在数据的整个生命(使用)周期中需要分阶段与分场景式的保护。一则是在数据生产环节作为数据持有者对所产生的数据集合的控制权保护,该控制权意味着权利人对所占有之数据集合的处置权。即谁有权使用,以及在何种条件下可以使用?但法律的直接赋权会导致相关权利人权利行使的过于排他并固化已有数据集合,从而有违以提高社会福利和经济效率为宗旨的“数据驱动型经济”之需求,更不利于数据流通。二则是在数据流通环节间接构造作为数据需求者对可流通利用的数据集合的访问权。从数据市场的发展趋势与交易习惯来看,数据作为权益混同的“聚合型财产权益客体”今后将更倾向于从数据财产权、控制权之固化的直接赋权保护走向数据访问权之灵活的间接权益保护。因此,目前优选的进路应当是以塑造可信赖的数据经济为目标,通过现行私法框架内权益保护与行为规制相结合的方式,促成数据市场化交易的综合激励。
总之,基于智能时代数据商业化利用的实践可知,数据访问权是为应对数据流通过程中数据持有者的垄断情形以及满足数据需求者的访问需求,以避免第三方过多干预与降低交易成本,从而缓和数据市场失灵局面与促进自由交易。
(五)小结
经由目前有关人工智能实务发展态势与学理探讨趋势之观察,妥适的数据保护规则设计应当是根据具体的数据应用场景以及数据特殊权益的多重私权属性之有限排他性保护需求,进行综合性的均衡考量。就此,人工智能大模型技术背景下应当注重数据流通环节以激励数据交易为目标的制度设计抑或改良。应然层面首先应暂且摒弃传统单一的数据财产权及其衍生型态之直接赋权。其次,经由权利束维度的多重权益考量,明确数据共享与利用的效率需求,再过渡到基于占有保护与技术措施之多层综合的控制权保护模式。然后,以之为前提塑造务实高效的数据访问权保护模式。由此,不仅是出于对现行法稳定性的尊重和兼顾效率原则,而且可通过体系性的解释与规整,逐步形成数据访问权的正当性基础,以及实现可商业化利用之数据作为私权客体的现行法综合治理目的。

03

私法框架下基于交易之数据访问权的确立与体系展开

(一)数据访问权在数据商业化利用过程中的功能定位及其构造之必要

数据访问权在功能上通常被视为是缓解“数据孤岛”现象的一种制度手段,以便需求者能够“解锁数据”。如前所述,有学者倡议在法律上赋予相关权利主体以“数据产权”等财产权化的方式,以实现对数据在市场经济活动中的占有、使用、收益与处分等物权性权益的强保护。但该方案仅停留在理论构想阶段,实践基础并不扎实,且存在明显的数据界权成本问题。其后,有学者经由权利束维度的多重权益考量,并基于效率原则和对数据财产权论的修正,主张尊重权利人对数据的事实控制,创设有利于竞争且能相对控制数据使用权的权属。即实现数据单一财产权路径保护至多重权益保护之数据控制权进路的转变。然而,二者都容易导致数据垄断问题,且该问题在人工智能技术加持下将更为突出。就此,有必要基于数据特殊权益的多重私权属性,通过构建数据访问权之制度激励打破信息孤岛、盘活数据存量,从而更好地访问和利用数据(集)。

如前所述,数据访问权的成立前提是尊重数据控制者为收集数据所付出的劳动与资本投入。从技术上讲,人工智能大模型技术背景下实践中智能设备数量和数据种类的增加通常要求数据生产者在使用数据之前将其转化为可用的结构。这个过程被称为“数据整理”,包括设计和实施一个数据模型,使得机器自动生成数据(Machine-Generated Data,简称MGD)。MGD不仅可以由传感器产生和传输,而且还可以在准备使用数据时被处理和结构化。换言之,该过程可以看作是对数据生成的投资,但又与动态数据库高度相关的“劳动”概念下的投资有所不同。至少,这需要以特定的数据库和它们的结构为着眼点,经过例如人工智能等算法程序更繁复的再加工,具有更为明显的“劳动投入”,而且其最终成果须借助电子设备、网络表达呈现出来。加之MGD生成的数据通常很有价值,其包含所有用户的行为痕迹、活动轨迹、事务信息以及应用程序、服务器和网络移动设备等明确且实时的信息记录,具有通过数据大模型进行商业化利用的巨大潜力,因而访问这类数据(集)往往需要付费。而且,相较于传统数据库的法律保护,通过人工智能技术的数据抓取、学习、输出过程显然更为复杂,已然超出传统知识产权的范畴,需要更为统合的多重私权协调治理。
(二)数据访问权私法构造在人工智能大模型技术场景中的具体展开
法律意涵上私主体间的权益(利)通常包含三项基本要素,即特定的权益主体、清晰的权益内涵和明确的权益客体范围。作为权益复合型的数据访问权构成也概莫能外。该权益是权利人进一步收集、加工、使用、交易等后续商业化利用数据行为的合法性基础。例如,人工智能大模型数据训练的合法抓取以数据的访问权为前提,从而展开后续数据集合的处理(学习)等再利用行为。经由数据需求者在私法框架下符合法定条件时的请求和双务合同关系中的权益,数据控制者必须提供数据或允许其访问数据,进而帮助数据共享,具体详述如下。
1.权益主体
人工智能大模型服务提供者、技术开发者等为主要权益主体。数据控制者通常包括数据的生产者、持有者,而数据的需求者通常又包括数据用户、第三方等。进而要处理好两个层面的关系:(1)数据控制者和数据用户之间的关系;(2)数据用户、第三方和数据控制者之间的关系。显然,大模型背景下相关数据产品和服务将使企业和客户获益。这些受益人包括人工智能开发人员、科研工作者、文化产业机构、小企业、记者以及参与其中的社会公众等。数据持有者并不拥有对数据的绝对排他性权利,也没有法律上事先排除许可的选择。相反,数据即使没有商业实践中共享的事实依据,至少在理论上亦可由所有市场参与者积累。因而有数据访问需求的个人、法人与非法人组织既是数字市场的重要组成部分,又是法理上数据访问权的权益主体。
需注意的是,我国法语境下权益主体的数据访问权之请求权依据与国外法律学者倡导的“竞争损害理论”有所不同,多而是应以现行《数据安全法》《个人信息保护法》《人工智能办法》等法规的监管访问制度为规范基础。譬如,《数据安全法》第3条第1款规定,“数据处理,包括数据的收集、存储、使用、加工、传输、提供、公开等。”该法第41条同时要求“国家机关应当遵循公正、公平、便民的原则,按照规定及时、准确地公开政务数据。”另外,《个人信息保护法》第7条、第10条、第13条第6项、第27条、第45条第3款、第58条等规定以及《人工智能办法》第5条、第22条等规定均有涉及数据(包括经处理后的个人信息)开放共享的方式、合规要求与请求权主体等事项。
2.权益内涵与客体范围
私主体间的权益内涵通常体现为民事主体的特定利益,其通常能被涵摄于我国《民法典》第3条规定意义上的“合法权益”要件。同时,(私)权益的内容既可以来源于法律规定,也可以在私法自治的范围内来源于当事人的约定。数据访问权的权益内涵在学理上首先表现为允许对可商业化利用数据(集)的接触权(access right)。但与欧盟法语境下在规范层面的接触权概念表达有所不同,我国法上通常称之为数据访问权,且目前数据访问权往往又以“公开”“开放”等为关键词的形式在立法条文中呈现。
数据访问权的权益客体通常指向市场中可商业化利用的数据(集)。这些具有商业价值的数据集合在法律上可作为一种市场交易关系中的客体对待,进而为法律关系主体之自然人、法人与非法人组织服务,并具备以下几项特征:(1)作为无形客体且具有一定独创性。数据在价值的形成和实现过程中都只能借助特定的技术手段、网络与电子设备装置等以无形的方式呈现与利用。而且,基于不同程度的加工与(资金)投入符合著作权法上的独创性要件保护以及投资要件保护,因而也容易与现有的知识产权保护制度对接。(2)秘密性与价值性交织。无论是前述MGD生成的数据,还是经收集者不同程度“粗细加工”后的数据都具有商业利益与使用价值,而且这些可商业化经营数据通常与秘密性并存。由于担忧所控制之数据集合的财产性利益被窃取,数据持有者往往不愿通过公示、公开来确定其权益边界,而是通过相应技术措施以秘密信息的方式将之保护,所以与一般知识产权的公开保护方式不同,其难以直接适用某一私法单行法而达至保护目的。(3)规模性与可支配性并存。一方面,人工智能大模型技术背景下要求有作为数据访问权客体的足够多数据的“投喂”,才能满足数据大模型的运行需求。另一方面,海量的数据通常可通过载体介质固定下来且受代码、技术规则的控制,因而可被数据持有者所支配。其目的在于一则通过技术手段确定数据权益边界的同时,起到稳定数据财产性利益转换的目的;二则在发生相关数据集合侵权情形时,也容易明确权利人的权益范围。
通过特定技术手段的界分和控制,目前学界与业界都较为认可可商业化利用之数据属于私法上的权益客体,其自然也属于数据访问权的权益客体。而且,在法律规范依据层面,这些数据集合如前述较为适合在有限排他性保护需求的基础上作为特殊权益的多层综合保护路径选择。
3.权能实现
人工智能的数据大模型因可接入DeepSeek、音视频生成、金融、医疗、自动驾驶等各行各业而具有通用性,其提供的信息内容与机器所需而合成的数据具有强大赋能性,不仅是人工智能时代的新型数字基础设施,而且在法律上需要分层分类进行规制。法理上数据访问权的权能实现过程是相关权利人在数据流通环节数据访问请求权的实施;同时根据是否产生对价给付可大致分为有偿访问与无偿访问两种类型,即以付费与免费为界分构建数据交易与流通体系。而在行使数据访问请求权时,一则需要考虑所访问数据集合是否被控制保护,二则需要注意是否有权以合法正当的方式访问、收集、处理目标数据(集)。
一方面,在数据有偿访问类型下基于数据流通环节激励交易的维度,私法框架内可考虑的法律适用分别为知识产权、民事权益、反不正当竞争三个主要层面。
首先,部分可公开的数据集合由于具有较高的独创性,可构成知识产权客体维度的“数据产品”,进而适用以确定性权利保护为己任的知识产权法,确切地说著作权法的相关规定;譬如可借鉴适用有关数据库的著作权授权许可(包括法定与意定许可)交易关系进行调节。
其次,就构成不确定性权益保护之不公开的数据商业秘密,则视其(包括技术、法律、内部管理等)保护措施程度与状况而进行访问。一则通过许可谈判后的数据集合亦可流通共享,二则对确属商业机密无法公开的数据则应当予以尊重和禁止访问。当然,其间的许可谈判常常与特殊的技术控制措施相联系,从而需要根据现行商业秘密制度进行个案分析与具体对待。
再次,同样在不确定性权益保护层面,还应考虑的是作为数据资源、服务(例如类似于电力服务)的数据目前在实务中往往通过数据买卖、许可、服务等合同性的方式征得相关权利人的授权同意,进而实现数据访问利用之目的,这俨然已成为当前数据访问权能实现的主流方式。基于各人工智能大模型应用场景的具体需求,对经由合同性授权的数据交易关系应秉持“容忍原则”;例如,既允许个性化对价给付的意定访问授权许可交易,也容忍在有些情形中基于经济效率的大规模格式合同之数据访问、传输协议(比如API数据接口合作协议)的智能签订与履行。而且需明确,今后努力的方向在于保障消费者权益、数据市场流通和促进商业模式创新的基础上,如何通过合同方式创设双方的利益平衡。
最后,应看相关数据垄断行为是否符合作为规制数据竞争利益之反不正当竞争法维度的强制许可情形。不正当竞争行为是对广义上私法权益的一种侵权行为,因此对权利人而言,无论国家是否对该不正当竞争行为予以制裁,他都不能不受干预地完全依据自己的意思来决定是否适用请求权的私法救济。这在数据访问许可情形中亦然,故而相关数据需求者也享有反不正当竞争法上的请求权。数据市场参与者的不正当竞争行为后果由于人工智能技术的加持容易放大,加剧“数字鸿沟”现象。故此,应然层面需要作为兜底选项的数据访问权之强制许可及时介入予以缓和。经由上述逐步分层检索,若符合其间任一部门法的适用条件,则可实现人工智能大模型背景下数据有偿访问的法律效果。
另一方面,基于对创新的激励与公共利益的维护,数据无偿访问类型主要如下:
其一,可通过借鉴著作权法中的合理使用制度,充实人工智能大模型背景下数据访问权的权益内涵与权能实现方式。笔者认为,还应妥善利用《民法典》《电子商务法》《著作权法》《数据安全法》与《个人信息保护法》等法律中有关合理使用与数据访问之私权性规定的现有规范资源。譬如,一则我国《民法典》第999条、第1036条先明确规定了(个人)信息数据处理者的相关免责条款;二则,在此基础上,《个人信息保护法》第13条第1款第2至7项就有关个人信息数据访问、处理等合理使用情形无需数据信息持有者同意,作了进一步的整合与细化规定。因而在规范基础层面,应当体系性地通盘考虑相关数据访问权之合理使用的权能实现,且需注意各具体规定之间的衔接。为减轻数据流通与利用过程中的利用方责任,以及降低市场交易成本,当前实践中通常是与数据利用者事前签订“Robots协议”的方式来实现。该协议目前已是人工智能技术背景下一种用以维持数据持有者与数据需求者之间利益平衡的常规操作,通过事先(自动)签订使得二者间的利益不致过度倾斜,也是数据无偿访问过程中的一种“免责协定”。
其二,以所谓的“数据利他主义”为导向,即拥有数据集合控制权的自然人、法人与非法人组织可以主动同意,以自愿和免费的方式分享他们因公益所需要的数据。在法定许可情形中,数据需求者之公共利益的正当性抗辩通常很难证成;反之,如果数据持有者无论是默示还是明示地表示因公益而公开数据,其自然可成为人工智能大量抓取数据之侵权行为的合理抗辩事由。就此,仍需注意权益边界的把握。例如应当将相应的数据访问权限范围仅限于公共健康医疗、教育培训、市政建设、司法公开、基础设施改善等公益事业领域。亦即在公共利益的框架下,可公开数据的无偿访问还包含经济和社会政治因素的综合考量。
其三,须明确就作为信息知识的数据而言,知识产权等权益保护是例外,公有领域是原则。显然,相较于受法律保护且技术上层层设防的商业数据,其他处于公有领域的海量数据也是人工智能大模型“食料”的重要来源,而且其常常是许多作为数据处理者的中小微企业的访问对象。加之,人工智能算法技术抓取这些数据行为本身亦可促进更多的数据要素流动和扩大数字产业的创新基础,从而对此应当适度激励并提供便利。

04

FRAND原则视域下人工智能大模型创新中的数据共享与权益保护并举

我国现已正式实施《民法典》《个人信息保护法》《数据安全法》《人工智能办法》《互联网信息服务深度合成管理规定》等法律法规,为人工智能大模型技术背景下数据的商业化利用提供了制度基础保障。即便如此,由于技术业态的迅速发展且涉数据的有关纠纷复杂,无论是现行法本身还是在其解释与适用方面仍有较大的改善空间。实践中,个人与小微企业财产权(益)保护具有促进(社会)自治和市场创新的特征,但正是由于行业内许多大企业的共同存在,才帮助和促进了该行业内中小企业的发展。即,小的生产单位若想取得成功,在很大程度上要依赖于在产业图景中的一家或多家大企业。如此产业内大小企业既相互独立又相互依存的纽带关系在当前大数据产业中亦然。人工智能企业创新的前提是大规模数据流通与共享,因此需要打破现有数据企业间的“数据壁垒”,以避免大型数字平台的“锁定效应(locked in)”与市场失灵。同时,应当转换思路,从更为积极与高效地激励数据接触与流动维度思考问题,即在尊重现有规则的前提下,考虑如何通过适当的制度整合与改良而更有效地利用数据集合。譬如,在数据大规模共享、访问的具体收费标准构建方面借鉴适用源自专利法上现有“公平、合理、无歧视(Fair,Reasonable,andNon-Discriminatory,FRAND)”的授权许可规则,从而有利于降低交易成本和提高市场效率。

(一)从行政主导到市场导向之人工智能数据治理的利益平衡实现
近年来,欧美都十分重视人工智能技术在大模型领域的开发和利用,同时在政策和立法等规制理念方面也各有特色,具有比较借鉴意义。
其一,欧盟在人工智能数据利用的法治化管理方面一直处于全球立法实践的前沿。一方面,欧盟委员会于2021年4月21日通过《人工智能法》提案,该提案是全球范围内首部系统化规制人工智能的立法提案,细化了人工智能四级风险框架,例如通过禁止“无差别的大规模监控”来进一步保护个人隐私。另一方面,继《通用数据保护条例(GDPR,2018)》《非个人数据自由流动条例(2018)》《数字内容指令(2019)》《数字市场法案(DMA,2020)》等之后,《数据治理法案》从个人数据与非个人数据、基本权利保护、主体准入资质、政企公司合作、业务操作规则、跨国监管协调等不同面向大致勾勒了未来数据要素流通利用之生态图景的欧洲方案。其后,欧洲议会又相继通过《数据法案》《人工智能法案》,旨在一则确保更广泛的利益相关者能控制数据;二则确保更多数据可用于创新用途,同时保持投资数据生成的激励措施,譬如要求数据持有者有义务向有需求的用户及其许可的第三方提供数据的访问权限,从而使得数据在市场交易中的价值最大化。诚然,这些法案的立法目的在于保护个人信息数据的同时促进数据共享。例如,根据《通用数据保护条例(GDPR,2018)》第6条第1款第f项的规定,数据处理(利用)的可行性取决于是否符合预先约定的(假设)同意声明中的标准。该法案认为企业的数据处理利益应优先于数据主体的隐私利益,以此激励数据的再加工与流通。但欧盟目前并不主张通过例如直接创设新的知识产权或者个人数据权等方式进行立法变革,而是更注重利用现行法框架并辅以政策引导的方式加以改良,比如间接通过在合同实施层面设立数据访问权的方式来回应实践所需。因此,结合欧盟人工智能技术规制与数据治理的立法发展路径可知,今后数据治理的方向将更侧重于可商业化利用数据流通与共享过程中的正当性基础构建,即如何合法有效地通过实施大模型等技术来利用数据(集)。
其二,美国有关人工智能大模型技术侵权案件纠纷走在全球实践的前端,例如近来屡屡身陷诉讼囹圄的Open AI公司要求法院驳回作者们根据美国加利福尼亚州法律和《数字市场法案(DMA,2020)》而提出的相关索赔。即便如此,美国对人工智能研发过程中的知识产权问题,目前采取相对统一的价值指导和原则性规定予以处理,尚未出台具体规范。出于推动人工智能创新、审慎立法、防止法律与技术进步脱节等考量,美国对人工智能的治理采取“先产业发展后立法跟进”模式,即在AI研发过程中不注重著作权保护,而是依赖于企业自觉、社会舆论、司法和行政系统的事后回应来解决知识产权争议。因此,尽管美国近年已出台较多关于促进和治理人工智能技术的法案,但与欧盟有所不同,美国主要是采用市场自治和政府规制“双管齐下”的治理路径。同时有研究者指出,美国目前以《算法问责法案》为引领,旨在创建一系列在公共治理场景中人工智能应用的程序化问责路径。所以,美国在有关人工智能的数据治理方面,基于其在全球互联网领域的垄断地位目前在法政策与立法实践上更倾向于尊重市场规律,主张“公私共治”,且相较于欧盟当前相对严苛的数据市场管制更显从容。
为避免因头部数据企业的垄断行为而招致行政监管介入之被动局面,导致交易成本增加,需要有相对有效且主动的数据利用规则路径改良。例如,通过数据访问权的私法构造而缓和之,从而跨越“数字藩篱”与促进产业创新。数据经济治理早期阶段主要着眼于保护信息自决权不受国家和私人行为者的侵害,有较多公法色彩,而当前各发达地区的数据保护正努力往以市场为导向的模式发展。与欧美情形类似,我国人工智能产业发展也需要体系化的治理方案,特别在有关数据市场参与主体的私法权益保障方面。弱化行政主导,强化市场导向之私法框架下的数据访问权构建既有现行法优化整合适用的可行性,又是目前数据交易与共享的实践所需,进而有助于实现数据市场的利益平衡。
(二)秉持FRAND原则之于数据访问权实施的正当与必要
数据访问权的构造旨在加强数据市场中各交易主体间的信任。从数字经济产业发展的角度看,缺乏信任是发展“数据驱动型经济”的首要挑战,比如欧盟希冀通过近年颁布的《数据治理法案》促进具备信任度的数字经济。由于缺乏信任,实务中许多数据企业往往以数据访问和共享会产生安全问题为由而拒绝开放数据。国外已有研究从法经济学维度证明,开放的数据信息共享平台在标准必要与互操作性情境中反而可以消除相应的安全风险,特别是在智能驾驶领域。所以,应当坚守鼓励创新、技术中立、互信互认、预防风险的立场,完善人工智能大模型背景下海量数据交易过程中的分类分级、质量保障等管理制度和标准规范。在现代风险社会中,通常有必要通过事先的制度和规则设计建立“系统信任”来降低、规避风险。这在很大程度上能消除市场交易陷入无序、不可知和不可信状态的危险。就此,基于以信任为前提的数据市场化交易的现实需求,通过例如数据访问权的合理规则设计与路径选择,不仅有助于重塑数字市场的信任,亦可缓解当前数据垄断的现实风险。
然而,近来我国有学者质疑,数据访问权的确认标准往往取决于特定经济与技术背景,因而通过一套稳定不变的权益规则来完成数据访问权制度的构建较为困难;尤其在是否收费问题上,不同的行业和主体存在着较大的区别和复杂的利益冲突。就此,欧盟法院已制定出一种值得借鉴的谈判机制,即通过限制当事人提出其对手拒绝谈判的论点,最大限度地减少竞争损害,以调和双方对立的利益。欧盟法院与之相关的里程碑式案例是“Huawei/ZTE”案。该案涉及被诉侵权人滥用市场支配地位,以实施其涉嫌滥用的拒绝许可(数据)行为。如果遵守谈判程序以防止滥用权利而拒绝许可之行为,法院将为处于支配地位的专利权人执行标准必要专利(SEP)提供安全港(safe harbor),也即上述提及的FRAND原则随之确立。同时,立法例上前述欧盟《数据法案》的第8条第3项明确规定,所谓“数据接收者(data recipient)”有权在例如遵守许可协议之义务中相对方所提出的FRAND原则性声明的前提下,向数据持有者主张非歧视性地获得相关必要的数据信息。据此,在满足有关要件后,作为第三方的个人、法人与非法人组织有权且有必要以FRAND原则为遵循,平等、合理、无歧视地访问所必需的数据信息,从而逐步实现前述建立“系统信任”之规则设计的初衷。
(三)FRAND原则在人工智能数据大模型访问场景中的具体展开
在具体数据交易之对价给付的标准构建与价值衡量方面,笔者认为应当贯彻FRAND原则,即应当围绕FRAND原则展开许可费用的定价,并将之贯穿于相关法律适用的各阶段。申言之,在数据有偿访问的对价补偿方面,引入前述知识产权领域更准确地说专利权许可中的FRAND原则。例如,通过在FRAND条件下数据(集)访问的额外价值补偿制度构建,使得类似于守门人的数据持有者可以从这一交易机制中获益。作为一种强制许可语境下的对价补偿机制,数据权利人可以就此获得经济利益的补偿,进而实现数据市场的利益平衡。有国外学者指出,数据市场强制许可要件之构成以及竞争利益均衡标准把握的决定性因素在于,数据的控制是否允许公司逃避竞争规则或因控制而形成对跨市场竞争的阻碍。另外,就非歧视要求而言,可根据数据控制者自身掌握的信息范围提供非歧视性条款,数据需求者起初只要提供必要的信息进行验证即可,具体的FRAND标准执行将在个案谈判过程中才逐步落实。
进言之,合理使用制度通常针对的是对一些价值量相对不高且保护措施较弱之数据集合的无偿访问,而在FRAND原则框架下有关高质量数据集合的有偿许可具体制度构建属于数据商业化利用的核心议题,更应受到重视。即借鉴标准必要专利实施领域的FRAND原则,基于前述数据驱动型经济发展的内在信任要求,刚好可以对标该原则项下的标准必要专利权利人与标准实施人在许可谈判中所应遵守的诚信义务。而且事实上数据共享、交易价格的确定也应当遵守“公平、合理、无歧视”原则。只要某一特定数据持有者在数据交易活动中存在与某一市场主体以市场最低价进行交易,后续的其他市场主体均应同样获得以该最低价或在该最低价合理范围内浮动的价格与其进行交易。在立法实践维度,目前全球范围内欧盟在该原则的贯彻方面较为先驱并已有文本呈现,具有参考意义。例如,《欧盟电力条例》第23条第5款规定,“对消费者访问数据不得收取额外的费用,但对于其他有资格的主体(例如提供数据服务的受监管实体)来说,各成员国应确保其访问数据的费用都是合理、正当的,且方便需求者对目标数据的访问”;同时,该法第24条要求各成员国应该保证获取这些数据时满足具有互操作性、非歧视性以及透明的标准。
尽管如此,有关在FRAND条件下数据访问的许多具体细节问题仍有待回应,比如数据商业秘密保护的确切范围、同意FRAND许可补偿的概念、数据中介(组织)的作用以及损害赔偿的可行性等。由于数据控制权是一项有限排他性的权利,若无法达成FRAND补偿协议,数据持有者很可能会拒绝共享数据。如果第三方随后根据相关法律起诉要求(强制)访问获取数据,数据持有者可能会反诉,要求为获取数据确定FRAND补偿。如此频繁的诉讼成本与潜在的法律风险显然会影响行业内人工智能技术的更新迭代,因而还需要不断优化机制。
从比较法上看,前述欧盟《数据法案》作为以行政监管见长的横向法规,将成为今后该区域各个不同行业和纵向领域非个人数据(商业数据)访问提纲挈领式的法律基础。但在当前人工智能大模型技术发展的起步阶段,应当以鼓励创新为主,适当的行政引导为辅。因而,前述美国式以数据市场化利用与自治为主以及行政干预为辅的相对“粗放型”政策基调则更适合我国当前国情。即我国今后还需以市场为导向,考虑相关数据法规在具体个案实践适用过程中的部门差异。譬如,今后可通过更加细致的部门法规和标准规定具体的访问条件,以应对FRAND原则适用各数据应用场景的不同需求。
综上所述,数据访问权的确立标准往往依赖于特定应用场景与技术背景,涉及复杂的利益衡量,这在人工智能大模型技术运用背景下更加凸显。因而在数据流通环节先通过一套相对稳定且分类分层的权益保护规则以间接赋权之方式完成数据访问权制度的构建,然后在是否以及如何收费问题上,基于不同的行业和市场主体,在个案谈判中贯彻适用所谓“数据访问的FRAND原则”而灵活应对。若此,在实现保护相关数据持有者权益的同时,还能降低侵权成本,提高数据市场交易与流通的效率,从而促进人工智能大模型的实践发展与产业创新。

05

余论:警惕权利泛化、激励数据共享

数字经济时代,数据生产者、控制者往往因经济利益倾向于垄断数据并阻碍数据要素的流通,因而有关数据商业化利用规则的不确定性首先会影响到各行业内作为需求方的中小微企业。数据驱动的创新也因此受到阻碍,从而不仅提高了市场信息成本与准入门槛,也降低了现有市场的可竞争性。这显然与我国的国家政策要旨相悖。笔者认为,有必要以当前人工智能数据大模型发展为契机,基于可商业化利用数据多重私权属性与有限排他性的保护需求,在私法框架内坚持技术中立、FRAND许可、多重保护等原则下,主张数据的积极访问、有效流通与权益保护同步。在不轻易变革现有信息系统、规范制度与数据资源控制权以及管理格局的前提下,明晰责权利,适当提高侵权门槛,以最小成本促进数据要素资源高效共享和利用。

诚然,单独私法维度数据访问、数据确权、相关数据交易规则的安排难以完全解决数据流通问题,今后还应基于数据治理维度从市场、行政、立法、司法等方面对数据共享问题进行整体把握。本文仅试图在目前数据直接赋权理论甚嚣尘上的研究背景下,通过对数据权益分阶段、分类分层间接稳定法律保护的冷思考,试图挣脱权利泛化的洪流,希冀为大模型背景下数据流通环节数据访问权激励制度的合理构造尽微薄之力。


   通知公告

  • 暂无相关记录!
【编辑:杨昊一