数据作为一种新的生产要素,与传统的生产要素如土地、资本、劳动力和技术等,有很大的不同。传统生产要素,往往有越用越少的性质,因此,它的积累很难实现量的跃升。有的要素用完了就没有了,或是有折旧。除了技术要素以外,其他要素有边际报酬递减的特征。但是,数据资源有边际报酬递增的效果,也就是说,当数据规模越大、种类越多时,它越能焕发出强大的生产力作用。
数据要素不会随着使用逐渐减少,还与数据的另外一种特征有关,也就是数据是在生产和消费的过程中产生的。因此,越生产、越消费,数据资源越多。就当前而言,还有五大问题待解,这也是全人类共同面临的问题。
第一是数据的产权。传统生产要素的产权相对来说比较明确,所有者、使用者和受益者分别是谁,一目了然。但是数据作为一种资源,存在产生数据的人没有很好地获得回报的问题。比如消费者在进行消费的时候,产生了数据资源,这些数据对于企业和公共管理者而言,有很大的利用价值,但这种利用价值并不一定被消费者本人所获取。因此,这个数据到底是属于个人,还是属于企业,企业有没有权利利用个人所产生的数据去牟利?如果仅限于在与消费者互动的过程中使用,以提高生产者的效率,那还可以另当别论,但企业有没有可能把消费者产生的数据拿去转让获利,这就比较有争议。此外,消费者产生的数据具有公共性,当这种公共性被用来进行公共管理的时候,也会涉及授权问题。这些问题需要有制度建设来进行明确,数据产权的所有权、使用权和收益权需要好好界定。
第二是隐私保护。一段时间以来,在国内外都出现一些大数据被转让、买卖、公开甚至滥用的现象。这些问题让公众对于个人数据隐私安全产生担忧。公共用途以及企业用途,如何做到保护个人隐私?如何有效地避免泄露?公共权力跟个人隐私的边界在哪里?这些也值得去探讨。
第三是对大数据垄断的担忧。对于垄断,传统经济学主要是由市场份额来进行判断。但在大数据时代,一些平台经济如果要发挥功能,天然就需要有大规模的用户和数据。这有利于提高资源配置效率,但也客观上存在一些“大数据杀熟”等企业利用大数据优势来侵犯消费者利益的问题。在大数据时代,如何定义垄断?如何界定垄断的危害?这些问题在国内外学术界和政策制定界都还在进一步探索,还没有完全的定论。
第四是数据的公共安全。这既包括我们把数据汇总到某一公共平台的时候,如何防止数据泄露、滥用或被私人用于牟利,也包括一些平台经济在涉及跨国经营的时候,如何保障一国的数据与其他国之间,既能有效地建立安全边界,又能在特定领域进行跨国协调和配合。因为大数据本身具有规模经济性,如果数据不流通,就可能难以实现应用价值。对此,目前一个比较一致的看法是,算法可以无边界,但原始数据要设立好防火墙。但也有例外,如在抓捕跨境犯罪时,光有算法共享可能也不够,还会涉及数据的沟通。再如跨国界的联合开发,如果仅有算法的共享,终端的研发者可能很难在数据上发现价值或者问题,会影响开发效率。这都是理论和实践中需要去探讨的问题。
第五是数据开放共享。公共数据平台在发挥用途的时候,需要向研究者进行开放。数据具有正外部性特征,把不同的数据汇集到同一个平台上,比单独利用一种数据,所焕发出来的效能更大,甚至可以呈几何级数增长。但这里面就涉及到几个问题:首先,我们通过什么样的机制让不同的数据汇集到同一个平台上来?中国目前在这方面走在世界前列,比如通过政府的协同来打造大数据中心、智慧城市、城市大脑等。但协调仍是一个难题,且不说去协调企业所拥有的大数据,连政府不同的部门之间,其所拥有的数据都很难归集到同一个平台上来。其次,就算数据都汇集到同一个平台,谁来开发也是个问题。一些平台的数据建设者,本身并不一定直接去开发数据,产出可以解决实际问题的应用场景。而能够开发应用场景的科学家,如何使用平台上的数据来做科学研究?科学家利用这些大数据所产生的成果,如何界定其知识产权?