本文为万向区块链首席经济学家邹传伟博士在2019“数字化一带一路”国际高峰论坛上的演讲。整理自现场速记稿。
数据商业的现实问题
谢谢主持人,谢谢各位嘉宾!非常荣幸来参加这次分享活动。从经济学的角度看,目前互联网上存在这样的商业模式:浏览器、搜索引擎和社交网络等中心化平台给网民发布免费的新闻资讯并满足社交需求,让后者付出让渡隐私的代价,并和广告商进行合作,向网民定向推送广告。
现今的互联网商业模式
那么,这里面有什么问题?第一,个人隐私无法得到有效的保护;第二,没有市场机制在其中产生作用。一个经济活动里如果没有价格机制在里面,就意味着自然配置效率不是最优的。所以现在很多专家在讨论Web3,一些项目在做这方面的尝试,它的特征就是明确对数据隐私引进了一套市场机制。比如说,广告商为向我定向推送广告,我需要把我的一部分隐私数据开放给它,但是作为代价,我要获得相应的资产,然后我再用这些资产向内容生产者购买新闻资讯。
由上面的例子可以看出Web3的核心逻辑:一方面,更好地保护数据隐私,让数据由所有者掌握;另一方面,在互联网上有价值在流动。从这个视角下出发,Web3已经不完全是一个技术问题,还涉及经济机制问题。
现在,我们将这个Web3经济体归纳为分布式经济体。它的概念核心是某种稀缺资源的生产和分配,并且资源通过市场配置而非中心化的方式解决。在Web3例子中,数据隐私和新闻资讯是稀缺资产,通过区块链引进某种价格机制。经济体中没有一个中心化平台在协调运作,而是通过区块链实现了社区的自治,经济活动的基础设施实际上是由社区来共建和共享的。
今天我们讨论数据治理还有必要澄清一个概念,政府部门对外提供征信报告,与商业机构内部信用分析有很大的不同。征信是一个很重要的金融基础设施,征信报告是政府对外提供的很重要的文件。各个国家对征信有一系列通用但又非常特殊的规定,比如采集个人信息时,需要信息所有者同意。如果向某个征信机构提供他的不良信息,要事先告知他。不良信息存在保存期限,过了5年或者10年就会被自动删减。征信报告查询是有权限且需要经过授权的。而互联网公司或金融机构内部对客户进行的信用评估,是内部使用,不会造成公共影响,受到的监管要少得多。所以我把两者作为区分,接下来我们讨论的内容属于第二个方向。
征信与内部应用
数据隐私的交易原则
数据隐私有没有可能进行交易,这是隐私经济学的范围,这个问题非常重要。在互联网刚兴起的时候,已经有学者做过这方面的研究,但总的来说这方面的研究非常少,而且密码学和区块链的发展会产生更多新问题。
隐私经济学里指出,隐私涉及个人和他人、私有和公开的边界,是个人尊严和自由、自主的重要方面。隐私不是排斥共享个人信息,而是要有效控制共享的过程。不管从行业实践还是从研究来看,我觉得数据交易的空间是巨大的,有两方面的促进因素:一方面,随着传感器和其他技术的发展,数据来源多样化;另一方面,数据分析手段,也是非常多样化的,特别像人工智能的发展。总的来说,新算法在不断涌现,很多新类型的数据得到了应用,应用场景不断拓展。
数据隐私能否交易
但数据交易市场面临典型的市场失灵问题。我国很多地方也试验过大数据交易,但效果不是很好。原因在于数据隐私如果作为一种商品存在特殊性:第一,数据的所有权往往不明晰,数据的复制和传播非常之容易。数据很容易在没有合理授权的情况下被搜集、存储、复制、传播和使用。第二,数据的使用是非竞争性的。数据可以被反复使用,并且数据的使用不会降低数据的质量或数量。第三,数据的使用是非排他性的。比如,一辆车在同一时间只能允许一个人乘坐,但数据不一样,不同人能在同一个时间使用相同的数据。这些特殊性就导致了数据交易市场面临的市场失灵问题。
交易问题
这里我要强调数据隐私的交易原则:第一,数据主权原则,在不影响数据所有权的前提下进行数据使用权的交易。第二,有序交易原则,在隐私保护的前提下,有序交易数据的使用权。第三,有偿使用原则,数据使用者要向所有者进行付费。
交易原则
数据治理的定价方法
截至目前,我一直在说明,数据治理中市场机制是一个重要手段,而数据使用权市场的核心问题就是数据定价。
一是绝对定价。我们目前不存在集中化、流动性非常好的数据交易市场,也不存在一致被认可的定价方法。目前在媒体行业里,包括有线电视、报纸、期刊、信息终端等,一般会采取订购收费的模式,隐含着成本定价方法。数据的提供者会计算数据需要投入多少人力和钱,再根据目标利润率确定最终定价。而前面已提到,互联网是通过免费提供新闻资讯,获取个人隐私信息,并通过广告变现来实现利润。我觉得市场机制和价格机制是相辅相成的,目前不用担心数据的绝对定价在理论上没有公认答案。一旦将市场建立起来,通过大家的买卖,自然会形成定价基准。
绝对定价
二是相对定价。绝对定价是非常难的,这一点对任何其他金融资产都是一样。而相对定价指的是给定一个数据和一个共同任务,评估每组数据对完成该任务的贡献。直观来说,大家可以设想一个人工智能算法,被用来评估基因和疾病之间的关系。假如我从很多人手里得到了一组基因数据,然后将这些数据合并在一起训练人工智能算法。最后的问题是,评估谁的数据对我的贡献更大。数据是千差万别的,有的数据价值高,有的数据价值低,但通过相对定价,能精确评估各自贡献高低。
相对定价
以上是邹传伟博士的分享全文,随时关注我们,第一时间获取区块链相关干货。