当前位置:首页 > 范文大全 > 公文范文 >

公文范文

数据变革、数据理论与数据治理:,一个简要述评

2021-11-03 13:07:57公文范文
方燕隆云滔〔摘要〕本文阐述和探究了数字时代下的数据变革趋势及国家支持政策、数据经济理论和数据治理的基

方燕 隆云滔

〔摘要〕本文阐述和探究了数字时代下的数据变革趋势及国家支持政策、数据经济理论和数据治理的基本问题。首先,促进数据要素的运用与发展已经成为全球共识。其次,基于不同假定和市场情境,学术界对搜集与使用用户数据问题的理论研究在数据共享的效率影响方面得出了不同结论:当消费者是否理性、是否拥有信息优势的假定不同时,数据优势是否会被滥用、数据共享是否会提升效率的研究结论完全相反;在数据技术、数据交易、数据支付等不同市场情境中,会出现多种福利结果,如效率提升、市场失灵、服务提供者可能滥用数据信息优势等。最后,学术界对于数据治理方面的研究主要围绕数据产权的界定与分配、数据集中及数据(和算法)伦理责任等三个方面展开。数据产权界定和分配主要依据数据分类分级原则对初始数据进行判定;数据集中主要从可触达性或可及性而非产权角度、从数据产业价值链条的角度来审视;数据(和算法)伦理责任包括可解释、可问责、透明、正义与中立等方面的义务。本文的探究和梳理有助于深化对数据的认识和治理。

〔关键词〕数据变革;数据理论;数据治理;数据市场;数据产权;数据集中

中图分类号:F49    文献标识码:A    文章编号:1008-4096(2021)03-0015-13

一、引  言

以大数据、云计算和人工智能等为代表的新一轮科技革命和产业变革,正在深刻影响着人类的经济社会生活并改变着产业发展格局。由于大数据的使用、算力的提高和算法的突破,人工智能得以快速发展与广泛应用,呈现出深度学习、跨界融合、人机协作、群智开放和自主操控等新特征。人工智能越是“智能”“智慧”或“人格化”,越需要获取、存储、分析、处理和使用更多的个人信息数据[1-2]。大数据与算法规则(特别是智能算法)之间存在紧密关系。数据要素是决定数字时代特别是移动互联网时代下企业存亡的关键维度。

随着数字经济向纵深发展,确保数字市场充分有效竞争和维持强劲的研发创新激励成为互联网监管和治理的一个重要话题,数据治理是其中的重点和难点。无论是欧盟及其成员国,还是美国国内各司法辖区都已经或正在推动数字监管的立法、司法和执法工作。在国内,2020年12月,中央政治局会议和中央经济工作会议确定了强化反垄断监管和防止资本无序扩张的基调,并提出要完善平台企业垄断认定、数据收集使用管理、消费者权益保护等方面的法律规范。随后,中央政法委、最高法院、中国人民银行、银保监会、国家市场监督管理总局及交通运输部等部门纷纷响应并做出相应部署。近几年来互联网经济中频繁涌现屏蔽封杀、大数据杀熟、排他性交易等乱象是反垄断执法的重点。2021年初,国家市场监督管理总局先后对阿里投资银泰、腾讯阅文收购新丽传媒和顺丰收购中邮智递等三起未依法申报实施经营者集中的违法行为进行了行政处罚,调查了阿里的二选一等行为,处罚了京东、天貓和唯品会的不正当价格竞争等违法行为。尽管国内外数字监管动作不断,但目前对互联网特别是数据治理规则理念的理解和认识仍不够深入和全面。

尽管几十年前就有不少针对用户数据搜集和使用问题的学术研究,但进入移动互联网时代后,大数据技术及应用的迅速发展变化促使学术研究进程加速、研究重点发生改变。当前围绕用户数据搜集和使用问题的理论和政策研究虽有所推进,但仍有许多课题要攻克。数据治理成为全球各国政府和学界讨论的重要议题。为了更好地看清数字时代的未来,很有必要深入探究数字时代下数据及其技术带来的深刻变革,梳理用户数据搜集和使用问题的理论进展,并提炼出数据治理过程中涉及的经济学基本理论问题。

二、数据变革趋势及其发展政策

(一)大数据变革

在数字时代,越来越多的活动被数字化,虚拟网络空间产生的颗粒化数据(Granular Data)呈爆炸式膨胀,数字网络平台及其相关技术可以便利地获知特定个人(或群体)的诸如年龄、性别、地理位置、家庭成员组成、饮食习惯、人口和生物统计概况等信息。无论是企业(如互联网科技企业、电信运营商和智能终端制造商)还是相关组织机构(如政府机关、行业协会商会)都能够相对较为便利地收集到全样本数据[3]。相比以往,可搜集的用户数据规模和范围不可同日而语[4-5]。同时,企业也能借助自动处理软件和算法规则在短时间里分析、处理和使用这些数据,并在此基础上形成规则化的决策流程。除公共数据由政府掌控之外,其他商业性的社会数据大多由互联网通信运营商(如中国移动、中国联通和中国电信)、移动智能终端制造商、互联网服务提供商(如美国的GAFAM、中国的BAT、字节跳动、美团和滴滴等),以及专门收集、处理和销售数据资料的数据运营(经纪)公司所掌控。

大数据对消费者和生产者裨益良多。企业通过收集、处理有关用户行为和特征的数据来归纳用户的基本属性、预测用户的行为(如喜好品位、习惯和心理)[6],透析用户的兴趣点和痛点,从而实现精准营销(Targeted Marketing),如推出新产品和改进既有产品、提供个性化订制服务、精准化广告投放和实时供给、精准诊断当前现状和预测未来趋势(如疾病、自然灾难等)[7]。消费者在享受算法规则、语音识别、图像识别、无人驾驶等数据技术带来便利的同时,消费者提供的数据在这些技术的实现中扮演着驱动算法不断优化迭代的角色。而不断优化的软件算法规则与不断积累的海量数据及其不断增加的潜在价值之间的循环驱动,是互联网(或人工智能)科技巨头核心竞争力的真正源头[8]

(二)用户数据要素的争夺

人类文明的每个重要阶段都有其关键性资源,如19世纪的煤炭、20世纪的石油和电力。到21世纪,大数据俨然成为新“原油”和新“电力”,是数据驱动式研发(Data-Driven Innovation)的基础设施性资源(Infrastructural Resource)[9]。对数据的搜集、分析提炼、合成流转乃至使用将贯穿整个数字产业链,尤其是数据的收集和分析环节。

对用户数据要素的争夺已成为现代企业特别是互联网平台竞相角逐的主要内容,也产生了很多纠纷案件。2017年,微软旗下的职业社交网站领英因以用户隐私保护为名阻止雇员评估服务提供商hiQ Labs未经授权抓取领英的公开用户数据而被hiQ Labs起诉、京东旗下“京东微联”智能家居应用软件因将用户个人WiFi密码上传至京东服务器而被起诉、华为新款手机荣耀Magic因收集用户的微信聊天记录被腾讯起诉、Facebook因数据泄露而被美国国会传唤等,这些都是互联网巨头或相关制造商争夺(或控制)用户数据而引发争议的典型案例。

2017年,阿里系下子公司菜鸟网络与国内最大的综合性民营快递公司顺丰速递之间,因顺丰的丰巢自提柜物件数据信息共享问题而发生“丰鸟大战”,其本质是对快递物流数据信息控制权和话语权的争夺。2017年,亚马逊以137亿美元的大手笔收购全食超市,被业界解读为亚马逊看中全食超市积累的海量顾客数据,能助力亚马逊IoT+AI战略积累实体的实践场景。IBM、FAMGA和BAT等科技巨头都在“争先恐后”布局大数据产品和服务,而GE、西门子、亚马逊和阿里等诸多工业制造或电商公司都对外宣称自己是一家数据公司,从中多少都可以领略数据竞争的重要性,一个争夺数据要素的竞赛正在拉开序幕[10]

(三)大数据的使用及其发展政策

互联网用户数据不单单通过提供更深刻、更丰富和更细致的信息(知识)实现企业的商业价值,还能通过揭示诸如疾病、外界气候和官员腐败等信息来实现政府公共价值。随着互联网和大数据变革向深度和广度不断渗透,数据经济得到了国家越来越多的重视。

2017年12月,中共中央政治局第二次集体学习强调,“审时度势精心谋划超前布局力争主动、实施国家大数据战略加快建设数字中国”。刘鹤副总理指出,“数据作为生产要素,反映了随着经济活动数字化转型加快,数据对提高生产效率的乘数作用凸现,成为最具时代特征新生产要素的重要变化”。大数据于2014年首次写入政府工作报告,后来相继出台《促进大数据发展行动纲要》《“十三五”规划纲要》,以及各部委跟进出台诸多促进大数据发展的政策文件。这一系列行动使得2016年成为我国大数据的政策元年。2017年,《大数据产业发展规划(2016—2020年)》将大数据列为国家级战略并形成发展部署。2020年4月,中共中央國务院发布《构建更加完善的要素市场化配置体制机制的意见》,首次将数据与土地、劳动、资本、技术等传统要素并列,提出要加快培育数据要素市场。在2021年3月的两会中,数据发展战略问题也成为讨论的一个焦点,并写入《“十四五”规划和2035年远景目标纲要》。在欧盟,以践行数字化单一市场战略为己任的欧盟委员会,于2016年11月发布《欧洲数据自由流动倡议》以最大化数字经济增长,并解决数据所有权、互操作性、可用性和访问等一系列新兴问题。

三、数据理论研究进展

(一)研究用户数据的文献演进:SPV情景与BE情景

早在20世纪70、80年代就有产业组织学领域的学者开始研究用户数据,试图从经济学角度解答这样一个问题:一个互联网平台(如一个社交网络)是否能在不提高价格、降低数量或减缓研发创新的前提下,借助消费者数据供应来滥用市场势力。学界先后基于不同情景衍生出两个相互承接又对立的理论派别。

1.在消费者理性和处于信息优势的情境下,数据使用会提升效率

这一派学者的理论工具是博弈论和信息经济学,结论是基于数据的市场势力是不可能被滥用的。主要研究的问题是,在考虑到用户数据的不对称信息效应时,市场一边相对另一边享有对个人数据的更佳信息时会带来什么影响,特别关注研究消费者行为高度理性而服务提供者遭受信息劣势的情景[11]-[15]。早期研究的综述请参见Acquisti等[16]、Budzinski和Kuchinke[17]和Budzinski和Stohr[18]。Stigler[13]、Posner[14]、Varian[15]等先驱性文献考察了消费者极端理性且相对企业拥有数据信息优势这样一种不对称情景,被称为Stigler-Posner-Varian(SPV)情景。研究发现,在SPV情景下,对个人数据的使用越频繁、精细,越能提高经济效率和社会福利。这是因为消费者比企业拥有更多有关自身偏好、品位方面的信息,消费者针对服务提供者的策略性行为被极大抑制,同时也让依托用户数据的市场势力滥用行为变得更加困难。这个效率促进型的研究结果使得早期文献聚焦于如何设计消费者激励机制,以诱导其披露更多的个性化数据[14],前提是这些被诱导披露的数据信息不被极大浪费[12-19]

2.在消费者有限理性和处于信息劣势的情境下,数据使用会抑制效率

随着移动互联网和数字经济的普及,有关消费者数据搜集和使用问题的经济学研究呈现全新面貌,出现诸多新洞见,进入了研究的第二个阶段。这一阶段的文献不再假定消费者极端理性、企业面临信息劣势,而是假定消费者有限理性、天真幼稚,服务供应商拥有信息优势,研究结论是效率被抑制。这些文献的研究重点转变为相关企业何时、如何和为何使用消费者个性化数据,以及这些数据的商业价值如何等[20]-[32]

相对于SPV情景,数字经济的信息不对称效应往往被扭转,服务供应商相对消费者更加了解其偏好品味,而且消费者往往过于乐观地认为自己的行动十分理性。随着行为和实验经济学对产业组织理论的渗透,越来越多的实证经验证据也显示:消费者获得的信息未被充分利用,并存在框架和锚定效应(Framing and Anchoring Effects)、损失规避(Loss Aversion)、显著效应(Salience Effects)和满意即可的行为(Satisficing Behaviour)等诸多心理影响;同时还发现,消费者往往是非理性的,无法正确预测自身行为和决策间的经济关联,行事时过于信任他人[32]。企业拥有信息优势而消费者有限理性的情景常被文献统称为行为经济学(Behavioural-Economics,BE)情景。

相对于完全理性消费者拥有信息优势的SPV情景,在消费者有限理性且面临信息劣势的BE情景下,以消费者福利受损为代价的滥用数据行为比比皆是,尤其是当企业拥有数据优势赋予的市场势力时,更容易出现滥用行为,并确实存在采用滥用策略的激励动机和外在条件,因而更可能导致社会福利降低,经济效率受到损失。即便对于消费者群体中同时存在完全理性者和有限理性者的情况,效率抑制的结论同样成立。

(二)数据市场

現有相关文献将基于(用户)数据的市场分为三种基本类型:数据提取和保护技术的数据技术市场(Data Technology Market)、数据作为交易标的数据交易市场(Data Trading Market),以及个性化数据作为支付或货币使用的数据支付市场(Paying With Data Market)。每一类市场都存在各自的技术问题和难题。

1.数据技术市场

在数据提取和保护技术的数据技术市场,精细先进的提取和分析软件(由挑选和使用数据的公司需求所激发)时时刻刻在与同样先进的数据拦截软件(由关注个人数据保护的消费者和重视保护本公司收集数据的公司需求所激发)进行竞争。基于数据的市场力量和信息不对称程度越大,数据技术市场越可能出现。一方面,先进的数据提取技术可以在用户毫不知情的情况下收集到所需要的数据。如很多互联网用户根本没有察觉Cookies在定期追踪自己的在线冲浪行为,自然也就不知道这些Cookies的数量及自己被收集的数据量,更不用说获知这些数据后续的流转和商业使用情况。德国的Facebook反垄断案显示,现有的技术已经能够做到即便用户未访问相关网站或使用相关服务,同样能收集到用户的个性化数据[33]。另一方面,拦截技术(如广告拦截器)能够助力用户控制自身的个性化数据。理论上,数据提取技术和拦截技术之间的竞赛会促进经济效率和社会福利的实现[21]。但是,如果数据提取技术在互联网巨头雄厚财力的支持下超过了面对着毫无组织性和有限理性的用户的数据拦截技术,可以预期这将对消费者福利带来负面影响。

2.数据交易市场

如果用户的个性化数据拥有商业价值,围绕这些数据的交易市场就能促进数据的有效配置[15]。数据交易市场面临的首要问题是,一旦消费者数据被初始数据收集者获得并转售,消费者往往没有能力预测到自身数据的后续使用情况,这便产生了资源配置无效和用户隐私泄露的潜在风险。而另外一个重要问题则与数据价值相关。

一方面,很大程度上,用户数据的商业价值并没有明确的保证,真正能够确保用户数据价值的是整理和分析数据并从中获取有价值结论的工具和能力,这些数据处理技术才是企业真正的稀缺资源,并只有当事企业才能完全拥有和掌握[34]。鉴于此,平台企业对用户数据价值的了解程度通常要高于用户。另一方面,企业拥有很强的激励动机去操纵数据价值的对外透明度,目的是掩盖数据价值。这一点在2016年德国的Facebook滥用市场支配地位案中得到了很好体现。在该案中,执法者指控Facebook滥用其社交网络市场支配地位的行为主要体现为两点:一是在一般服务条款中使用消费者在竞争情境下不可能认同的数据使用规则;二是有意制造数据使用的不透明,特别是在第三方网站中。平台相对用户更了解用户数据价值,且平台有动力操纵甚至掩盖数据价值,使得数据价值的实现受到制约,数据交易市场存在失灵的可能。

3.数据支付市场

绝大多数互联网用户都会参与数据支付市场,为了能够享受到互联网产品(如服务和内容),用户愿意用个人数据来交换,而不是借助支付传统货币(零货币价格)或接受隐性的货币价格折扣来实现。只有在两个前提条件下消费者才能从零货币价格中获益:一是用零货币价格支付的产品服务给互联网用户带来的个人价值不低于被换走的个人数据给互联网用户带来的个人价值,二是互联网用户对个人数据及其使用带来的市场价值足够了解,此信息足够透明。由于互联网用户对数据价值的了解程度系统性地低于对货币价值的了解程度,数据支付市场隐含着交易成本问题。同时,现实中的互联网用户并非完全理性,这就意味着主观上的货币价值与其说是理性计算而来,不如说是惯例、经验或传统引致的结果。此外,只要在线服务生产商拥有信息优势,无论在服务市场有无市场势力,都可能存在滥用的动机和能力。

从互联网企业的角度而言,数据支付市场孕育了基于数据的商业模式——个性化、精准化。互联网经济理论的相关文献探索了私人订制模式有利可图的原因及其对消费者福利的影响等问题。基于数据的商业模式有三种常见表现。

第一种是精准化广告投放(Targeted Advertising)。互联网用户的个性化数据(尤其是行为数据)被用于揭示目标用户的偏好品位,进而向其进行个性化、精准化的广告投放。消费者在获取免费的在线服务和数字内容时需要用其注意力、个人数据等标的物来换取。由于互联网企业的广告业务本质上是借助间接(交叉)网络效应形成多边平台市场或新增平台边数来开创收入新来源,精准化广告投放进一步提升了从管控间接(交叉)网络效应过程中获得的盈利水平。根据个性化数据向特定的在线用户推送产品广告信息能够大大提高目标用户的购买概率,广告对用户的负间接网络效应相对降低,由于定向广告推送更有效率,广告商自然更愿意为此支付更高的价格,平台利润随之上升。精准化广告对消费者福利的影响并不明确。尽管相对于普通广告而言,定向广告对用户的干扰度下降[21-35],但定向广告的数量和渗透率更高,屏蔽隔离广告所要付出的成本也更大,数据安全和隐私被侵害的担忧也更急切[24-36]。要结合特定情景进行个案分析,才能对这两方面的利弊进行权衡。

第二种是个性化订制服务(Tailormade Services)。基于个人数据进行订制服务本身可以是一种产品,也可以是便利其他用户进行购买的一种营销方式和手段,如基于个人数据的搜索服务和推荐服务。在线搜索服务商(如谷歌搜索、百度搜索)依据关键词和特定要求提供搜索结果排序以满足用户的搜索偏好,而推荐服务商(如亚马逊、Netflix、Spotify、阿里和京东)基于目标用户和其他用户的消费历史信息进行有针对性的产品推荐。个性化订制服务更容易诱导发生额外消费,提高产品的流转率和销售利润。同时,根据消费者偏好塑造数字产品往往也提升了消费者的福利[21]

第三种是基于数据的价格差别和歧视(Data-Based Price Differentiation and Discrimination)。先进的个性化数据分析技术能够帮助手握海量数据的企业更准确地透视用户对特定产品的个人支付意愿信息,便于进行差别定价。理论上,基于个人数据的个性化价格接近于经典经济学中的第一价格歧视这种理想化情形。尽管目前暂时未广泛出现如此精细化的价格歧视系统,但已经出现试图让价格随着平台专用的搜索历史、位置、购买时序、智能设备类型等通用信息而调整的价格歧视初步版本,甚至还可以兼顾考虑一些动态定价因素[37]。然而,基于数据的价格歧视至少面临三个急需克服的问题。首先,要求数据的质量和数量足够完美,才能确保足够接近第一价格歧视。其次,数字时代下市场透明化的大趋势(如在线易得的无偏比价服务),使得基于数据的价格歧视情景增多,适用难度降低。最后,价格歧视行为谋取到的高边际利润可能受到有效竞争的蚕食,使得价格歧视的危害性下降甚至反转为有利因素。

理论上,在SPV情景下,基于数据的价格歧视可能会由于实现了效率所得和销量增长而起到提高社会福利的效果[13]-[15]。在消费者完全理性且拥有信息优势的同质化市场情境中,基于数据的价格歧视尤其可能提升福利水平。但是,在企业拥有信息优势的异质性市场情境中,则更可能降低福利水平[12-20-23]。此外,允许企业依据用户实际支付意愿索取价格会让消费者剩余被极大地转移至企业,出现转移分配效应。在BE情景下,对消费者福利的负影响可能更普遍,在具有如下特性的情景下更是如此:产品异质性(产品/服务差异性甚至个性化)、锁定效应和转移壁垒高企、消费者处于信息劣势[20-23]、有关用户数据使用的信息缺失[21]、競争强度缺乏令用户选择余地不足[30]等。此外,当用户为有限理性时,基于数据的价格歧视不仅可能降低静态的消费者福利[29-32],还可能降低动态的消费者福利,如劣质产品在市场上长期存续甚至一度猖獗[28]

现代在线服务市场(如通信市场)往往呈现BE情景特征。SPV情景假定潜在用户能充分利用可获得信息,足够理性地做出是否入网或下载安装特定应用的行为决策。然而,经验证据显示,用户往往会因信息冗长、语言复杂和自我无助感等忽视相关信息[22-31]。同时,还存在用户行为数据披露的偏好与其所宣称的偏好之间不一致的问题,从而出现隐私悖论[25-26]

在数据收集和分析阶段存在程度各异的规模经济和范围经济,这往往被认为是提升经济效率和社会福利的一个重要契机。这是因为,规模经济和范围经济会降低搜索服务和匹配交易的成本,促使一些原本不可能发生的新式交易批量涌现,还促进了研发创新活动,保障实现长期效率[38]。数据的规模经济和范围经济在一定程度上支持了“数据越多、纵向一体化越好”的论断。当具有不完全重叠数据资源的企业之间进行并购重组会壮大自有数据库容量及其信息量,便于改善现有产品质量和研发,从而推出全新服务。收集更多的用户数据便于企业更及时准确地预测和满足用户的差异化和个性化服务诉求,由此数据交易可能对于相关企业和消费者而言都是一种福利提升。

四、数据治理基本问题探索

数字时代下网络数据包括政府系统内部积累的公共数据,以及经济系统中积累的商业数据,后者可分为个人数据和非个人数据。本文所指的数据主要是商业数据。在对个人数据收集、分析和使用等各环节中进行治理时至少涉及数据产权的界定与分配、数据集中、数据(和算法)伦理责任等三大类理论议题[38]

(一)数据产权的界定和分配

数据产权配置是数据治理的一个首要问题。用户数据究竟应该属于平台还是用户?拥有用户数据的企业是否有权借助数据获利?经济学界和法学家对数据产权配置的看法和逻辑不尽相同甚至完全相反。

1.经济学家对数据产权的看法及其逻辑

芝加哥学派的逻辑能较好地解释初始数据的产权归属问题,用户数据归属于数据收集企业。个人免费享用的更高质量、个性化服务是通过让渡个人数据有偿交换而来。或者说,为获取用户数据,网站或APP通常提供超低价甚至免费服务。互联网用户提供个人数据是为了换取服务(如无需支付货币就使用搜索引擎、社交网络、即时消息、在线视频、地图或电子邮箱等),或者登录一个商业交易过程(如登陆淘宝、滴滴出行和美团点评等)。

Tirole[39]对用户数据的归属问题给出一个初步判断:如果企业收集数据需要创新性手段或承担较高的成本,就应允许企业持有数据并借数据盈利;如果收集数据很容易且成本低廉,数据应归用户个人;如果用户提供的数据与后续的数据处理之间存在明确界限,数据属于客户且可携带,只要客户愿意则可以将数据转移给第三方。在美国,从2014年起,患者可以获得自身的医疗数据并以标准且安全的方式存储。患者只需通过应用程序中的蓝色按钮,就能访问其电子病例档案和选择是否愿意将病例数据分享给医疗服务供应商。理论上,如果处理这些原始数据需要创新性手段或成本较高,原始数据经处理后形成的二手数据产权应归属企业。依照此逻辑,游戏内容是典型的用户生产型内容(User-Generated Content,UGC),应归属游戏平台;而游戏直播和解说则增加了新视角和新理念,赋予网络游戏新的价值、功能和性质,改变了其原本的功能或目的,构成对游戏作品的转换性使用,因而应属于游戏主播的著作权。

事实上,在实践中很难确定原始数据和处理数据之间的边界。首先,数据质量(客观可靠性)可能取决于企业的努力程度。网站和APP应用运营商面临的一个主要挑战是确保数据的可靠性、防止有人操纵数据,如卖家雇佣水军发布好评帖子(或给竞争对手差评)。淘宝和天猫则严厉打击卖家采用好评返现手段操控评分的行为,谷歌则加大投入以确保其网站链接排序(部分取决于其受欢迎程度)不会因某个网站人为增加点击量而被扭曲。如果平台投入巨资打击数据操控,以确保数据的可靠性并创造经济价值,平台则有理由索要相关数据的产权。其次,数据收集与处理相互关联。待收集的数据种类反过来取决于数据信息的使用,这使得更难在属于用户的原始数据与属于企业的处理数据之间做出明确区分。

从规范经济学角度来看,最佳的数据产权归属应按照社会福利最大化目标和成本—收益权衡原则来配置。将数据产权配置给平台企业能够诱导企业更好地收集和使用数据,产生更大的数据规模和范围经济,创造出更多的经济价值[40]-[42]。但是,这也可能提升平台采取反竞争行为(如价格垄断、合谋等)的能力和动机[43],存在侵犯用户隐私和数据安全的可能。由于用户无能力也无意愿开发数据,将数据产权配置给用户就不存在这一权衡问题。按照科斯定理,在交易成本足够低时,初始产权归属的划分不重要,通过交换对数据资源评价最高的一方总能获得数据产权。思想实验显示,即便宣称对隐私很重视的人也会以很低的价格出让自己的隐私信息[44]。这个现象印证了数据对于个体用户的价值低于其对平台的價值,这则意味着,将数据产权划归给平台可能更有效率,这也说明,个人对数据的评价无法反映数据的社会价值。

2.法学家对数据产权的看法及其监管思路

法学界对个人数据产权的归属问题也未达共识。一部分法学家吸收了芝加哥学派的观点,认同将个人数据产权划归平台。但是,更多的法学人士坚持认为网络世界产生的海量数据应归属数据的原始来源——用户个人。如果说印刷革命带来了知识产权、工业革命普及了专利制度,那么互联网数字革命必定带来个人数据所有权。根据法学家的理解,个人数据所有权同样包括产权制度的经典元素:个人要按自己的想法使用自己的数据、个人若想毁灭自己的数据无须获得任何“遗忘权”、个人可以随愿出售自己的数据以获取一定的利润回报。为了管理付费数据,可以尝试为每个互联网用户设立一个智能账户来存储信息并规定使用条件。让个人更多地控制其数字生活的“痕迹”带来的好处,但这一理解超过了纯粹经济意义上的公平范畴。

尽管不少法学家坚持互联网数据归属互联网用户的观点,但当今世界还没有一部法律体系承认个人数据所有权。这或许是因为个人数据产权下的数据交易市场缺乏效率。虽然直觉看来,个人数据所有权似乎会刺激个人数据市场的出现,但实则不然,个人数据市场会面临Akerlof式逆向淘汰问题,最终导致数据市场彻底萎缩或至少是令此市场不再重要。在将个人数据划归用户个人的法律制度设计下,当个人的在线数据能够以公平价格售卖,个人就有动力花费时间和精力故意增加在线时间和在线数据量。显然,这一道德风险行为会导致数据质量普遍下降,不能很好地揭示出偏好和品位等私人信息。理性的数据需求企业购买此等数据的意愿和出价水平都将下降,数据市场最终会萎缩。总之,如果数据产权划归用户个人则无法诱导出现数据市场,数据的价值将不能实现。

虽然将数据产权划归平台会带来潜在的隐私安全(Privacy Safety and Security)和数据垄断(Data-Opolies)等问题,但也不应因此就彻底否定平台对数据的产权。如果数据产权界定给平台,产权保护的方式尤其重要。法律经济学大师Calabresi[45]指出三种影响深远的资源产权保護规则:财产规则(Property Rule)、责任规则(Liability Rule)和不可转让性规则(Inalienability Rule)。财产规则是指除非产权持有者自愿转让,否则不得强制转让产权,且转让价格应由交易双方协商确定;责任规则是指非产权持有者可以不经过产权持有人的同意就提前使用,事后只需支付一个由独立第三方认可的公平价格;不可转让性规则是指即使拥有产权,也不能对其随意转让。Calabresi进一步指出,对于交易过程中不产生显著外部性的资源而言,当市场交易成本很低时,财产规则更有效率,通过自愿谈判能让交易各方满意;当交易成本较高时,责任规则可能要比财产规则更有效。对于会产生明显外部性的资源,产权应满足不可转让性规则。这三大规则后来成为全球各国制定数据政策时倡导遵守的基本准则。对于大部分的互联网数据,应当适用责任规则,可以允许需求者使用并与数据所有者商讨报酬偿付;对于一些会带来潜在外部性的重要私密数据,可适用不可转让性规则。当然,在落实数据产权保护的基本原则时,还会面临监控数据复制传播和使用的难题,需辅以区块链等新技术来解决。

总之,按效率标准,应将数据产权划分给平台,而其带来的隐私权和垄断忧虑则可通过产权保护来缓解甚至消除。

(二)数据集中

1.数据集中带来的复杂影响

用户的行为和特征数据越来越集中到少数大型企业中。首先,数据相对集中是随着业务的成功自然形成,成功企业的算法规则因受到越来越多数据的“喂养”而自然得到优化和升级,并无原罪可言。其次,数据集中通常可能产生提升经济效率的结果[46]。如数据驱动型并购交易行为借助数据重组,实现服务提升、价格降低和研发助推的效率促进式论断,正是2012年评分评论平台运营商Bazaarvoice并购其竞争对手Power Reviews时向美国司法部和法院提供的辩护理由,也是2010年Microsoft并购Yahoo搜索业务时主张的主要理由。最终结果是,前者被禁止而后者被批准,这是因为,前案交易促成一个垄断者,而后案交易培育和壮大一个能更有效地与行业领导者Google搜索进行竞争的对手。Telefonica/Vodafone/Everything Everywhere并购案(2012)和Publicis/Omnicom并购案(2014)均涉及数据分析服务提供商之间的竞争,并不直接相关于数据收集问题。最后,现代企业有时也可能借数据驱动策略获得、维持或强化不公平不合理的竞争优势,破坏竞争秩序和抑制研发创新活动[10-47]。正如OECD[48]的报告显示,大数据经济学倾向于诱导形成市场集中化和支配化的格局。当集中化是市场成功的结果时,数据驱动型市场能带来赢者通吃的局面。特别地,大数据在惠及消费者的同时也存在伤害消费者的可能,如私有数据(数据是互联网的新货币)和广告(时间是金钱)给消费者带来的直接成本,数据激发的市场势力带来的高价格、低产出、低质量和研发缺乏等[7]。避免此等潜在损害的常用手段是实施竞争政策和消费者权益保护。

涉及大数据的反垄断管制面临的一个首要理论问题是,相对而言,大数据驱动的经济行为是否更可能具有反竞争性。相关的政策问题则是大数据是否应纳入反垄断分析框架?如果应纳入其中,又如何纳入?其他更具体的问题有如,大数据对主导性平台的市场势力带来什么影响?大数据是否天然具有排他性?如何预防平台滥用数据优势?面对数据滥用时应如何应对和惩处?等等。对于涉及大数据的反垄断执法而言,目前主要关注数据驱动型并购、封锁数据原料(和拒绝数据开放)、凭借大数据滥用市场支配地位(如大数据杀熟)等。后一类问题牵涉必要设施理论和原则在大数据中的适用性探索。防范数据过于集中、实现数据效率是竞争执法的一个重点和难点,算法规则设计是否应遵守数据保护和反垄断法也是一个复杂的问题。

2.破解数据集中的潜在思路

针对数据集中的担忧,从以下两方面审视有助于消减甚至克服:

第一点从可触达性而非产权角度审视数据集中问题。将数据比喻为新原油在某些方面似乎有道理:原始数据和原油都需经过提炼才能变得有用。但是,两者存在重要区别:原油是竞争性的,某人消费原油,其他人获取变少;而数据是非竞争性的,某人对数据的使用不会降低或妨碍他人对数据的使用。从这个角度来说,真正要聚焦的不是适用于私人品的数据所有权(Ownership)概念,而应是数据可触达性或可及性(Data Access)概念。数据很少像私人品那样销售,而主要是为特定目的进行的授权。要解答的问题不是谁应拥有自动驾驶等网上冲浪数据,而是谁应该能触达这些数据和能用这些数据做什么。通常情况下,多个主体能同时设置多个数据收集装置,可以同时触达同一批数据。要求毫无理由地独家掌控数据会无故地限制数据的流通、共享和使用。从原始数据中提炼出来的某些信息可能会受到版权保护,但原始数据在现有知识产权制度下不受保护。数据提供商仍有动力囤积一些数据,有偿或无偿地提供给他人,并以私人合同的方式限制数据转售或再授权以控制数据流动范围。

第二点是从数据价值链的角度审视数据集中问题。从可触达性而非权属角度来审视数据垄断(Data Monopolization/Data-Opolies)问题是第一要义。第二要义是从整个数据产业价值链角度来解读数据集中问题:从数据收集、存储、分析、处理和使用这一整个链条来审视企业在数据收集阶段的优势是否会带来竞争优势和带来多大的竞争优势。显然,如果某个企业在数据价值链多个乃至所有环节都处于优势(甚至垄断)地位,其数据优势能彰显竞争优势的论断很可能成立。至少在这种情况下,数据优势直接影响着其他企业对用户数据的可触达性。狭义的数据优势仅仅是指数据收集阶段处于优势(甚至垄断)地位。其实,数据垄断化是体现数据多用途性的集中多样性(Concentric Diversification)。换用现代经济学术语表述,集中多样性就是数据要素的规模经济、范围经济和速度经济。大数据一般是指个人数据,理论上还应包括企业数据和政府公共数据等。按照数据生产或持有主体可划分为政府公共数据、企业数据和个人数据。政府公共数据是指政府及其行政机关在依法履职过程中产生或获取的以一定形式记录和保存的各类数据资源。企业数据是反映企业基本状况的数据资源,如企业财务数据、(研发、采购、生产和销售等环节的)经营数据、人力资源数据和通过授权直接或间接采集的个人数据。个人数据是以电子或其他方式记录的能单独或与其他信息相结合以识别自然人个人身份的信息,包括但不限于自然人的姓名、出生日期、身份证号、个人生物识别信息、住址、病史、电话号码和习惯癖好等。

(三)数据(和算法)伦理责任

总体而言,随着数字平台中存在的几乎无限的用户数据收集和处理能力,与有限的用户认知能力之间鸿沟的不断扩大,大数据在惠及用户群体的同时,也面临人身自由丧失、数据算法规则不够透明、算法责任担当缺乏及数据和算法滥用等担忧[38]。從这个意义说,大数据社会好比一个黑箱社会(Black Box Society)。需要特别强调的是,数据流通共享过程中的数据泄露和用户隐私问题。目前与数据竞争紧密相关的隐私保护竞赛尚未开始,但数据泄露和隐私侵害却频繁发生。2018年3月,英国Cambridge Analytical咨询机构滥用Facebook的五千万用户数据的丑闻持续发酵,促使世界各国加强对数据资产(特别是关乎企业重大商业利益的数据资源)所有相关方利益的协调和规范。中国银监会于2018年3月发布《银行业金融机构数据治理指引(征求意见稿)》,就相关数据治理问题征求社会意见,至此中国银行业金融机构全面的数据治理拉开大幕。随着数据泄露事件频繁发生,以及民众和政府对隐私保护的日益重视,数据治理和企业对隐私保护的竞赛将成为主流趋势。

个人数据信息分析与市场势力的联合不仅涉及隐私权,很可能影响消费者选择权、言论自由权和非歧视权等基本的人类权利。此外,大数据和基础算法还被赋予了诸多的伦理责任和义务,如算法规则可解释(Explainability)、算法后果可担责(Accountability)、算法透明(Algorithmic  Transparency)、算法设计遵守隐私保护、数据安全和反垄断要求、数据公正(Data Justice)和算法中立(Algorithmic Neutrality)等。在人工智能应用中兼顾个人、经济和国家安全保护,确保可用、可靠、可控,是急需关注的技术、经济、社会、法律乃至伦理道德问题[49]。学界和实业界就数据或智能算法的责任问题目前仍未达成一致,表现在如下四方面。

1.依靠数据和智能算法做出的决策和行为后果问责

谁应为借助大数据和智能算法做出的决策和行为后果负责,到底是数据和算法创造者(如程序开发者、独立第三方)、用户(企业管理层、商业企业)还是获益者(企业股东、管理层)?2017年10月,美国参众两院相继批准首部规范美国自动驾驶汽车产业发展的立法《通过革命性技术发展实现更安全交通的美国愿景(American Vision for Safer Transportation Through  Advancement of Revolutionary Technologies,简称AV START Act)》和《自动驾驶法案(Self-Drive  Act)》。美国自动驾驶汽车立法在加速(而非限制)自动驾驶技术和应用创新进程的同时,明确了自动驾驶汽车交通事故的责任主体。在大数据和智能算法的助推下,用户尤其是未成年用户对互联网产品(从在线游戏拓展至社交产品、社区产品、短视频产品等)的“上瘾性”不断增强,对屏幕时间的监控和管理责任应该划归平台还是政府?目前来看,腾讯对在线游戏时间进行监控、谷歌面向安卓用户推出数字健康功能,苹果则规定了用户在Ios系统中查看各应用程序使用时长和方式、设置单个应用每日使用时长上限,Instagram和Facebook也在跟进推出用户使用时长监测功能,这些无不彰显平台在管理使用时间和培养良好的网络使用习惯方面的主动作为。针对数字内容的监管也是平台主动或被动选择承担的职责。2017年末发生的虐童风暴尚未平息,2018年初网络世界对儿童的恶意(主要是邪典视频)又被掀开。色情和暴力等不良内容污染儿童(也包括所有成年人)的精神世界,平台应该承担起净化本平台内容的义务。

2.以反对数据歧视和数据透明等为表现形式的数据正义和算法中立

皮尤研究中心2018年发布的报告《算法面前的公众态度》指出,伴随着算法的普及,公众开始对算法歧视产生怀疑。报告中针对美国成年人的一项调查显示,58%的美国人认为算法不同程度地带有人为偏见,还对隐私造成侵犯,将被评估者置于不公平的境地。与求职歧视、消费歧视和司法歧视等一样,数据和算法歧视也前所未有地被制度化和系统化。法律仅规定要更小心和负责任地收集、使用和共享任何敏感数据显然是不够的。根据大数据的相关性原理,只是将敏感数据简单排除(简单脱媒操作),不能保证真正有效地防止数据泄露。这是因为,基于经此等操作后的数据仍能推测出被排除的信息。要识别和规避数据(和算法)应用过程中的数据(和算法)歧视和偏见,必须让数据(和算法)透明,增强个人知情权以对冲相关主体间的信息不对称性。此类问题面临诸多需要权衡取舍的两难抉择:如何确保既能够有效使用数据,又能够保护用户隐私和数据安全,防止隐私和数据泄露?如何在实现数据效率的同时兼顾数据正义?

3.算法透明

算法规则是否应该满足透明性原则?是否应该适当适度地对外公开算法源代码?国内外最新出台的相关法律法规对算法透明都有着不同考量。修订版《反不正当竞争法》专注于网络不正当竞争专条,而未考虑算法透明性,《电子商务法》(第34条)首次提出算法透明问题,规定消费者拥有算法的选择权,但未规定算法对外公开。美国计算机协会USACM就算法透明度和可担责性发布六条原则:意识原则,算法规则的利益相关者应意识到算法在设计、实施和使用中存在的潜在偏见及其带来的潜在危害;准入和补救原则,监管者应鼓励采用机制对因算法决策而受损的个人或群体提出质疑和纠正;问责原则,算法使用者应对算法决策结果承担无过错责任,即便使用者无法详细解释算法对结果的影响机理;透明原则,使用算法决策的机构对算法规则和决策给出解释,尤其在公共政策或公共服务环境领域下的数据来源原则,算法构建者应对训练数量来源进行说明,并对数据收集过程中的潜在偏差进行探索;可审计性原则,应对模型、算法、数据和决策等进行记录,以便在出现可疑问题时进行审计;验证与测试原则,算法构建者应严格验证算法模型,记录、公开验证方法和结果并定期测试,以评估和确定算法模型是否产生歧视性损害。2017年12月,美国纽约市议会通过算法问责法案,以解决市政机构自动决策算法的公平性、问责性和透明度问题。

雖然算法透明性早已进入国内外立法者的视野,但实质性地推进算法透明的政策原则仍缺乏成熟的时机。原因至少有三:首先,算法规则通常被认为是商业机密,立法要求公开全部算法会违背知识产权制度,会因损害相关企业利益而难以推进。其次,在实际操作上,难以明晰和监督算法公开的种类和程度。公开简单算法还是公开全部算法规则?主管部门也缺乏技术能力去检验或审计算法公开的落实情况。最后,算法过于透明反而会被恶意利用,如有些黑帽SEO公司利用谷歌等公司的收录规则制造海量垃圾链接以提升目标客户的谷歌收录排名,有些刷单公司利用淘宝、天猫等电商平台的公开算法进行刷单,以让目标店铺挤入最大流量页面等。实现算法透明性的预期效果需要精细化和配套化的辅助设计,这是一个综合了学理性和操作性的复杂问题。目前,算法透明慢慢被越来越多人关注。甚至有人认为数据日益成为公共资源,算法规则也应被界定为一种公共服务。美国电子隐私信息中心甚至倡导,在法律和技术的交叉点,算法规则公开透明是一项基本的人权。

总而言之,实施算法透明性和可担责性在实践中面临困难[50],如对外强制公布算法机密可能会降低相关企业的投资和研发激励。此外,单单披露复杂的程序代码不足以作为一个完整的透明化举措。还需花费资源和精力对算法规则进行调查和监控。当算法自动做出决策时,透明性和可担责性原则会面临挑战。

4.智能算法伦理

数字经济的发展严重依赖于大数据和人工智能算法规则,在此期间,人工智能作为互联网经济的延伸和拓展也得到长足发展。为了规范人工智能的发展,自2017年起,全球各国纷纷出台人工智能政策,其中大多涉及或聚焦伦理道德问题。未来生命研究院FLI在召开阿希洛马会议时倡导达成了23条AI伦理原则;德国发布《自动和联网驾驶》报告提出全球首个自动驾驶汽车的20条伦理原则;电器电子工程师学会IEEE发布《人工智能设计的伦理准则(第二版)》,全面阐述了人工智能13个方面的伦理事项。人工智能伦理道德的一个重要方面是给予机器人法律地位。韩国国会提出《机器人基本法案》,积极探索机器人法律问题。阿沙尼亚政府公布《人工智能法案》,考虑赋予人工智能代理人法律地位。欧盟议会通过全球首个《机器人民事法律规则》的决议,要求欧盟委员会提交关于机器人和人工智能民事责任的法律提案:成立统一的机器人和人工智能监管机构、采用登记制度和引入电子人格,并就伦理、创新和知识产权保护等提出建议。

五、总结与展望

本文较为系统地阐述和探究了数字时代下数据要素的发展趋势及其政策、大数据经济理论和数据治理的基本问题。当今时代,数字化、网络化、智能化的发展趋势让数据更加颗粒化,收集、存储、分析和使用数据的方式发生显著变化。其中数据及其算法竞争逐渐取代传统的价格、产品等方面的竞争而成为核心竞争维度。全球各国竞相支持大数据的运用与发展,试图为未来博取竞争优势。围绕搜集和使用用户数据问题的理论研究聚焦于企业借助数据供应滥用市场势力的可能性、可行性及具体数据市场问题的研究。基于消费者理性和拥有信息优势的经典经济学假定不认为数据优势存在被滥用的可能,普遍得到数据共享促进效率的结论,但后续研究的假设条件演变为消费者有限理性和处于信息劣势,研究认为,数据优势肯定存在被滥用的可能,数据共享会抑制效率。

在数据技术市场中,数据提取技术和拦截技术之间的竞赛会促进效率提升;在数据交易市场中,数据初始提供者不了解数据的使用情况和数据价值,导致市场失灵成为常态;在数据支付市场中,消费者不一定能从零货币价格中获利,在线服务提供者可能滥用数据信息的优势,同时不同的私人订制模式会对社会福利产生不同影响。

大数据时代数据治理围绕数据产权界定与分配、数据集中、数据(和算法)伦理责任来展开。数据产权界定和分配问题,首先要依据数据分类分级原则按初始数据和处理数据等类型进行判定。数据集中问题是指数据可触达性或可及性而非产权上的垄断,要从整个数据产业价值链条的角度来审视,而不能拘泥于数据收集和使用两个环节。数据(和算法)伦理责任包括可解释、可问责、透明、正义与中立等方面的义务。

参考文献:

[1]  杨明.确保安全、可靠、可控:兼顾人工智能应用和隐私保护[N]. 人民日报,2019-07-12.

[2]  郭军.从解放人的体力到温暖人的心灵:让人工智能更好造福人类[N]. 人民日报,2019-07-10.

[3]  Einav, L., Levin, J. Economics in the Age of Big Data[J]. Science, 2014, 346 (6210):
715-721.

[4]  Feinstein, D. The Not-So-Big News About Big Data[R]. Federal Trade Commission, 2015.

[5]  Feinstein, D. Big Data in a Competition Environment[J]. CPI Antitrust Chronicles, 2015, 5(3):
24-35.

[6]  Kosinski, M., Stilwell, D., Graepel, T. Private Traits and Attributes are Predictable From Digital Records of Human Behavior[R]. Proceedings of the National Academy of Sciences (PANAS) of the United States of America, 2013.

[7]  OECD of Competition Committee. Big Data:
Bringing Competition Policy to the Digital Era[R]. OCED Competition Committee Meetings, 2016.

[8]  Acemoglu, D., Johnson, J. A. The Emergence of Weak, Despotic and Inclusive States[R].  CEPR Working Paper , 2018.

[9]  OECD. Data-Driven Innovation:
Big Data for Growth and Well-Being[R]. OECD Publishing, 2015.

[10]  Stucke, M. E., Grunes A. P. Big Data and Competition Policy[M]. Oxford:
Oxford University Press, 2016.1-10.

[11]  Hirshleifer, J. The Private and Social Value of Information and the Reward to Inventive Activity[J]. American Economic Review, 1971, 61 (4):
561-574.

[12]  Hirshleifer, J. Privacy:
Its Origin, Function and Future[J]. Journal of Legal Studies, 1980, 9 (4):
649-664.

[13]  Stigler, G. J. An Introduction to Privacy in Economics and Politics[J]. Journal of Legal Studies, 1980, 9 (4):
623-644.

[14]  Posner, R. A. The Economics of Privacy[J]. American Economic Review, 1981, 71 (2):
405-409.

[15]  Varian, H. F. Economic Aspects of Personal Privacy[A].Daley, W. M., Iring,L.  Privacy and Self-Regulation in the Information Age[C]. Washington, D. C.:
U. S. Department of Commerce, 1997. 50-60.

[16]  Acquisti, A., Taylor, C. R., Wagman, L. The Economics of Privacy[J]. Journal of Economic Literature, 2016, 54 (2):
442-492.

[17]  Budzinski, O.,  Kuchinke, B. Modern Industrial Organization Theory of Media Markets and Competition Policy Implications[R]. Ilmenau Economics Discussion Papers No.115,Ilmenau University of Technology, Institute of Economics, 2018.

[18]  Budzinski, O.,  Stohr, A.  Competition Policy Reform in Europe and Germany-Institutional Change in the Light of Digitization[R]. Ilmenau Economics Discussion Papers No.117,Ilmenau University of Technology, Institute of Economics, 2018.

[19]  Akerlof, G. The Economics of Caste and of the Rat Race and Other Woeful Tales[J]. Quarterly Journal of Economics, 1976, 90 (4):
599-617.

[20]  Taylor, C. R. Consumer Privacy and the Market for Customer Information[J]. Rand Journal of Economics, 2004, 35 (4):
631-651.

[21]  Acquisti, A., Varian, H. R. Conditioning Prices on Purchase History[J]. Marketing Science, 2005, 24 (3):
367-381.

[22]  Gross, R., Acquisti, A. Information Revelation and Privacy in Online Social Networks:
The Facebook Case[R]. ACM Workshop on Privacy in the Electronic Society (WPES), 2005.

[23]  Hermalin, B. E., Katz, M. L. Privacy, Property Rights and Efficiency:
The Economics of Privacy as Secrecy[J]. Quantitative Marketing and Economics, 2006, 4 (3):
209-239.

[24]  Hui, K. L.,  Png, I. P. L. The Economics of Privacy[A]. Hendershott, T. Economics and Information Systems[C]. Amsterdam:Elsevier,2006. 1-23.

[25]  Grossklags, J., Acquisti, A.  When 25 Cents Is too Much:
An Experiment on Willingness-to-Sell and Willingness-to-Protect Personal Information[R]. University of California at Berkeley Working Paper, 2007.

[26]  Beresford, A. R., Kubler, D. , Preibusch, S. Unwillingness to Pay for Privacy:
A Field Experiment[J]. Economics Letters, 2012, 117 (1):
25-27.

[27]  Brown, I. The Economics of Privacy, Data Protection and Surveillance[A].Bauer, J.M.,  Latzer , M. Handbook on the Economics of the Internet[C]. Cheltenham, UK:Edward Elgar, 2016. 247-261.

[28]  Heidhues, P., Koszegi ,B. , Murooka, T.Inferior Products and Profitable Deception[J]. Review of Economic Studies, 2016, 84 (1):
323-356.

[29]  Hoffmann, F., Inderst, R., Ottaviani, M. Persuasion Through Selective Disclosure:
Implications for Marketing[R]. Campaigning and Privacy Regulation Working Paper, 2016.

[30]  Kerber, W.Digital Markets, Data and Privacy:
Competition Law, Consumer Law and Data Protection[J]. Journal of Intellectual Property Law and Practice, 2016, 11 (11):
856-866.

[31]  Obar, J., Oeldorf-Hirsch, A.The Biggest Lie on the Internet:
Ignoring the Privacy Policies and Terms of Service Policies of Social Networking Services[J].Information Communication and Society, 2018, 23 (1):
1-20.

[32]  Heidhues, P., Koszegi, B. Discrimination Naivete-Based[J]. Quarterly Journal of Economics, 2017, 132 (2):
1019-1054.

[33]  Budzinski, O.,  Grusevaja, M.  The (Behavioral) Economics of Privacy and Big Data:
Fundamental Implications and the German Competition Policy Case against Facebook[R]. Ilmenau Economics Discussion Papers, 2018.

[34]  Schwalbe, U.Algorithms, Learning Machine, and Collusion[J]. Journal of Competition Law and Economics, 2018, 14 (4):
568-607.

[35]  Tucker, C. E. The Economics of Advertising and Pricing[J]. International Journal of Industrial Organization, 2012, 30 (3):
326-329.

[36]  Anderson, S. P.,  de Palma A.Competition for Attention in the Information (Overload) Age[J]. Rand Journal of Economics, 2012, 43 (1):
1-25.

[37]  Budzinski, O., Kohler, K. H. Is Amazon the Next Google? [R].IImenau Economics Discussion Papers , 2015.

[38]  Martens, B. An Economic Policy Perspective on Online Platforms[R]. JRC Technical Reports, Institute for Prospective Technological Studies Digital Economy Working Paper , 2016.

[39]  Tirole, J. Economics for the Common Good[M]. Princeton, NJ:
Princeton University Press, 2017. 340-345.

[40]  Varian, H. R. Big Data:
New Tricks for Econometrics[J]. Journal of Economic Perspectives, 2014, 28 (2):
3-27.

[41]  Varian, H. R. Beyond Big Data[J]. Business Economics, 2014, 49 (1):
27-31.

[42]  Lewis, R., Rao, J. The Unfavorable Economics of Measuring the Returns to Advertising[J]. Quarterly Journal of Economics, 2015,130 (4):
1941-1973.

[43]  Acquisti, A., Brandimarte, L., Loewenstein, G. Privacy and Human Behavior in the Age of Information[J]. Science, 2015, 347 (6221):
509-514.

[44]  Athey, S., Catalini, C., Tucker, C.  The Digital Privacy Paradox:
Small Money, CostsSmall, Small Talk[R]. MIT Sloan Research Paper , 2017.

[45]  Calabresi,G. Property Rules, Rules Liability, and Inalienability:
One View of the Cathedral[J]. Harvard Law Review, 1972, 85 (6):
1089-1128.

[46]  Lambrecht., A., Tucker, C. E. Can Big Data Protect a Firm From Competition?[A]  Ortiz,A. Internet:
Competition and Regulation of Online Platforms[C]. Cambridge, MA:Competition Policy International,2015.155-166.

[47]  Stucke, M. E., Grunes, A. P. Debunking the Myths Over Big Data and Antitrust[J]. CPI Antitrust Chronical, 2015, 5 (2):10-18.

[48]  OECD. Data-Driven Innovation for Growth and Well-being:
Interim Synthesis Report[R]. OECD Publishing, 2014.

[49]  Richards ,N. M., King, J. H. Big Data Ethics[J]. Wake Forest Law Review, 2014, 49(2):
393-432.

[50]  OECD. Algorithms and Collusion:
Competition Policy in the Digital Age[R]. OECD Publishing, 2017.

Data Revolution, Data Theory and Data Governance:
A Brief Review

FANG Yan1,LONG Yun-tao2

(1.Aliresearch, Beijing 100102, China;2.Chinese Academy of Sciences Institutes of Science and Development, Beijing  100190, China)

Abstract:This paper describes and explores the trends of data revolution in the digital era and the basic issues of national support policies, data economy theory and data governance.Firstly, supporting the use and development of big data has become a global consensus. Secondly, based on different assumptions and market contexts, academic research on the collection and use of user data has reached different conclusions on the efficiency implications of data sharing. Under the classical assumption of consumer rationality and information advantage, data advantage is not considered to be abused and data sharing promotes efficiency; under the assumption of consumer bounded rationality and behavioral economics of information disadvantage, data advantage may be abused and data sharing inhibits efficiency. In data technology market, competition between data extraction technology and interception technology promotes efficiency; in data trading market, initial data provider does not understand data usage and data value, which often leads to market failure; in data payment market, consumers may not benefit from zero currency price, service providers may abuse advantage of data information, and different private customization modes may bring different welfare impact. Finally, academic research on data governance has focused on the definition and allocation of data property rights, data concentration and ethical responsibility for data (and algorithms).  The definition and allocation of data property rights are based on the principles of data classification and grading to determine the initial data; data concentration is mainly examined from the perspective of accessibility or accessibility rather than property rights, and from the perspective of the value chain of the data industry; ethical responsibility of data (and algorithms) includes the obligations of interpretability, accountability, transparency, justice and neutrality. This paper will help to deepen the understanding and governance of data.

Key words:data revolution; data theory; data governance; data market; data property; data concentration

(責任编辑:邓菁)

*收稿日期:2021-03-04

*作者简介:方燕(1981-),男,江西赣州人,博士,博士后,主要从事产业组织与反垄断、互联网经济学等方面的研究。E-mail:fy314159@sohu.com隆云滔(通讯作者)(1984-),女,湖南隆回人,助理研究员,博士,主要从事数字经济、技术创新与管理等方面的研究。E-mail:Yuntaol@casipm.ac.cn

猜你喜欢 数据治理 数据管理大潮下电子文件管理的挑战与对策北京档案(2021年6期)2021-06-30教育信息化背景下高校数据治理研究*中国教育信息化·高教职教(2020年9期)2020-11-02数据治理中数据智能分类技术的应用研究卫星电视与宽带多媒体(2020年9期)2020-08-04“区块链+社区治理”中政务服务场景的应用探究中国管理信息化(2020年11期)2020-07-14基于关联数据异常分析线损精益化管理研究与系统开发科技创新导报(2020年7期)2020-06-19新冠肺炎疫情促进商业银行加快数字化转型理财·市场版(2020年4期)2020-06-19大数据应用视角下的数据治理问题分析和更新数字技术与应用(2019年6期)2019-09-25开放大学数据治理框架研究中国电化教育(2018年8期)2018-05-14基于电力行业的大数据时代下元数据管理方法电脑知识与技术(2018年31期)2018-01-20大数据已成为基础通用技术中兴通讯技术(2018年5期)2018-01-17

推荐访问:数据 述评 简要