据We Are Social及Hootsuite统计发现,2017年全球使用移动设备的总人数已经突破50亿,也就意味着全球三分之二强的人都在使用移动设备。2018年是我国互联网行业深入发展的一年,7亿网民数量世界排名第一,月活跃移动收集已稳定在12亿左右,是名副其实的网络大国。
【区块链放大数据的价值】
Web 应用的单击流数据,IoT 传感器数据,等等。数据量比以往任何时候都要多,生成数据的速度也变得越来越快,而且数据格式也是多种多样。数据传入速度越快,数据来源种类越多,我们就越难从数据中获取价值。其实50亿人的互联网用户,但因为上述数据环节中的关键问题还没能解决,导致个人数据的流通收到严重限制。这也限制了我们获得更多的生活便利。同时,随着信息不对称的问题被互联网逐渐缓解,信用的不对称却还没破除。中心化的数据巨头占有了大量的个人数据,既不能也不愿提供给其他机构或企业来优化客户服务。因此随着日益严重的“信息孤岛”问题,我们的信任成本越来越高,引起了工作和生活的极大不便。 具体可体现在以下几个方面:
a)提供的服务越来越丰富,涉及的部门也越来越多;
b)与陌生人交易,我们非常担心被骗;
c)不管是雇佣还是合作,我们找到一个靠谱的人的成本仍然很高。
这些现象的根本原因,还是在于个人数据没有得到充分的流转和使用,如果这些数据在清洗后得以全面使用,那么就可以做到让数据多跑,让人少跑,提高社会运行效率。区块链则可以让数据所有权回归大众。如果你自己成为数据的主人,别人要看你的数据需要得到你本人的同意。如果你的数据别人需要付费来看,或者你的数据想要授权给别人,都需要得到你本人的确认,那么数据的安全问题就解决了。可以说,区块链这项未来最重要的底层技术,与数据这项未来最重要的社会资源结合在一起,能够释放出极大的商业价值、社会价值。
终端用户是所有数据的生产源头,他们理应享有自己创造的数据的最高权利。然而现实却是,用户的个人隐私数据在灰色产业链被盗窃、贩卖、非法使用,用户无法跟踪自身数据使用状况,也无法保护自身数据。理论上来说,数据生产方提供了服务,可以根据其服务供需情况,标出价格,收取一定费用。但由于数据持有者不能够很好地销售数据产品,直接获得收益,因此很多数据的获取难度大且长时间存留在难以让需求者接触的角落。另一方面,数据只能使用而不能被拿走,因此不会被复制泄露,拥有者可以持续通过服务获取收益。数据生产者愿意更积极收集数据,并提供更好的数据使用服务。整个数据共享使用市场就能够进入到良性循环之中。用户的数据并不属于用户自己,用户在数据流通环节中更是无法得到由自身数据产生相应回报,他们的这些数据所产生的商业价值,通常是被App Owner所独享,而并未分配给到数据的生产者AppUser。
中心化的数据交易平台,都会不可避免的沉淀数据。导致数据流通参与各方对中心化的数据交易平台的不信任。同时,行业也会普遍担心中中心化的数据平台有可能被巨头操纵,从而失去中立性。通过区块链技术,也可以搭建一个安全可信数据交易平台,数据提供方卖出的数据,将无法向以前一样无限次盗卖,其市场价值也不再随着随意复制而快速损减,同时数据安全也得到了保证。
通过区块链技术解决数据安全与权益划分,是技术发展的必然趋势,下文将对比国内最出名的两个区块链结合大数据领域的项目——AAA和GXS。
【AAA——海量Dapp和数据的共享开放平台】
AAAChain拥有海量数据,用户和客户资源支持,使得这个项目区别于其他任何竞品项目。AAAChain的目标是以去中心的数据开放交易平台为基石,以海量垂直场景应用组成的自治组织联盟为核心数据供应方,以可信可确权的数据流通为轴线,基于区块链技术改造大数据产业的生产关系和信任关系,建设全新的大数据共赢生态社区。
AAAChain采用统一用户数字身份,平台为每个用户生成一套非对称加密的公钥和私钥,私钥只有用户个人能访问。用户个人数据经公钥签名写入,仅拥有私钥的人可以查看原始数据,私钥意味着数据的唯一控制权。数据由数据服务商安装的SDK经过签名后写入分布式存储,并根据索引规则建立索引,再将索引存入区块链,以供搜索查询。在现有的技术架构和商业模式下,个人对自身数据的掌控力越来越弱。比如,我们的身体数据在体检中心那里,财务数据在银行那里,网购数据在亚马逊、淘宝、京东那里。在这种情况下,我们如果想要接受基于信用的服务,就需要通过外围的机构来证明自己的信用,所以,数据产生者却没有数据的掌控权,这是一个令人尴尬的境地,也是目前集中式数据生成和管控模式的弊端。区块链为解决这个问题带来了新的希望。相比于中央集中管控的数据生成和存储的模式,区块链是一个分布式数据库,就像一个公开账簿,它可以做到在各个节点上去中心化的同时记账,这就避免了单个机构对数据的垄断。
数据在共享交易过程中,存在被第三方或数据买家复制、留存、转卖等风险,数据资产权益无法得到保障,数据共享和开放可能就是在为他人做嫁衣,通过数据获得的收入,很可能也只是一次性的,无法持续。在数据资产权属不易明确,数据权属难以溯源,权益难以保护的情况下,数据提供方和数据需求方无法积极的参与数据交易。AAAChain数据开放平台提供用户隐私保护机制,对每个数据购买请求,平台会判断此类数据是否属于用户的隐私数据,如果是隐私数据,则触发隐私保护机制向用户申请授权。只有经过授权的查询或购买请求,才会继续执行交易。用户数据的内容由数据提供方App进行加密存储,第三方无法读取。交易过程中,数据购买请求里包含购买方的公钥,数据提供方先对存储的加密数据进行解密变成明文,再用购买方的公钥进行加密,把加密后的数据做为智能合约的执行结果返回给购买方。数据购买方用自己的私钥对数据进行解密,最终获得数据。数据开放平台拥有一套用户隐私授信体系,允许用户对某些数据进行一次性授信,基于授信的数据交易,不用再每次单独申请用户授权,交易成功后用户会自动获得AAAToken做为奖励。
目前(2018年5月),AAAChain 用于支持合约的虚拟机toolchain已经梳理完毕,项目代码也已经在代码平台Github上开源,接下来将就数据上链开始进行编码,项目进展较为顺利。AAAChain的战略合作方是环信,并且请到其创始人CEO刘俊彦作为战略顾问。环信拥有十几万家注册APP及十亿级别的激活设备、五千万的日活,相信其全球领先的即时通信云Paas平台可以无缝接入大量数据资源,这应该是目前其他项目难易企及的行业资源。
综合来说,AAAChain目标在于引入区块链和密码学相关技术,设计打造出一个公有区块链,通过智能合约、分布式数据库等技术,实现可接入海量Dapp和海量数据的大型数据共享和开放平台,比较符合区块链大数据平台的功能定位。项目整体在概念上十分完善,落地非常靠谱。
【GXS——面向大众的个人端区块链应用】
公信宝从2016年开始自主研发主链,主链在2017年1月12日上线,基于主链公信宝做了一个CBD生态,C代表布洛克城,每个用户都有一个数字身份。
B代表点对点数据交易所,目前已接入一些权威数据源,这是区块链在企业端商业化落地的公链项目。D代表开发者,开发者可以在这里写智能合约,并获得通用数字身份,另外,布洛克城也会给开发者带来百万数据流量,目前这块已有十个应用在同步开发,这些应用覆盖到金融、社交、游戏、衣食住行等领域。公信宝开发团队认为,只有让应用走入人们的生活,区块链才具备真正的价值。
GXChain是公信宝打造的一条底层公有链,这条公有链基于Graphene的底层架构,以DPoS(Delegated Proof of Stake)作为共识机制,支持每秒十万次交易的吞吐量,满足商用场景中高并发、高吞吐的需求。
与其他公有链不同的是,GXChain是一条有数据基础的公有链,在GXChain上开发应用,可以通过各类服务接口接入这些用户数据,让应用得以更好的服务普罗大众。未来,GXChain将部署虚拟机,从而可以执行可编译的智能合约,并且GXChain也将支持横向扩展,满足各类商业场景的需求。
公信宝DAPP产品主要包含2个模块:布洛克城和数据挖矿。用户要创建自己在布洛克城的居民身份并通过KYC,就可以凭着自己上传的数据来挖矿了。自此,用户就在链上拥有和映射了自己的真实世界身份。然后,用户可以开通智能数据采集和使用GXS购买数据来提示自己的算力,数据授权的越多,算力就越高,那么相应挖出的矿也就越多,收益也越高。
公信宝Dapp的数据都是保存到链上的,由用户自己的数据身份公私钥对加解密。为了让整个过程公开透明,公信宝会开放数据查询窗口,让用户都能确认自己的数据的确被加密保存在区块链上。公信宝的愿景是用区块链技术减少现实世界中坏人数量,用区块链技术来解决数据孤岛,用区块链技术来完成绝对信任。
【AAA与GXS项目对比】
区块链可以让数据所有权回归大众。如果你自己成为数据的主人,别人要看你的数据需要得到你本人的同意。如果你的数据别人需要付费来看,或者你的数据想要授权给别人,都需要得到你本人的确认,那么数据的安全问题就解决了。可以说,区块链这项未来最重要的底层技术,与数据这项未来最重要的社会资源结合在一起,能够释放出极大的商业价值、社会价值。下面我们从共识机制,行业资源,及项目进度三个维度来对比AAA和GXS这两个项目。
行业资源对比
AAA在数据获取这方面则似乎拥有极大的优势。AAAChain的战略合作方是环信,并且请到其创始人CEO刘俊彦作为战略顾问。环信拥有十几万家注册APP及十亿级别的激活设备、五千万的日活,相信其全球领先的即时通信云Paas平台可以无缝接入大量数据资源,这应该是目前其他项目难易企及的行业资源。AAAChain将联盟全球海量的垂直场景应用,在APP联盟整合后的海量数据基础上,对全球移动互联网几十亿受众数据进行采集、清洗、整合、挖掘,构建第三方精准人群数据开放平台。同时,由几十万家APP组成的联盟本身就有广告变现需求,可嵌入广告SDK进行广告营销投放,几十万家APP作为媒体主将吸引大量的广告主和数据分析服务厂商加入AAA生态。同时,APP也可以在体系内采购广告流量,满足自身增长需求。项目上线,就有可能形成从数据供应方到数据消费方的完整体内循环生态。相信在这方面AAA比GXS的数据收集要更多更快,作为大数据平台产品,在不长的时间内就会显现明显的差距。
项目进度对比
在前区块链时代,所谓“大数据“在大多数情况下都是用户被平台剥削了数据,用户既失去了数据控制权和隐私保障,又无法得到数据被平台利用和获利之后得到的分红。这是一个明显不健康的生态,用户并不傻,被平台公司实际坑过一次两次之后,加上引起社会关注的恶性事件的推动,这个模式无法长久。如何解决在使用这些平台的同时保护自己的隐私,保护自己的权益,已成为一个刚需。GXS具有先发优势,但仍处于摸索当中,AAA发布时间较晚,但用于支持合约的虚拟机toolchain已经梳理完毕,项目代码也已经在代码平台Github上开源,接下来将就数据上链开始进行编码,有后来居上的趋势。AAA Chain 如果能够落地实施,那么,它将极大释放数据交易的潜力,尤其是高质量的数据,也就是说,有了AAA Chain,拥有质量越高的数据供应商和个人,就有机会获得越大的收益。这才是更加公平、透明和开放世界应该有的商业生态。
共识机制对比
AAA与GXS的共识机制都为Dpos,目标是实现更快的出块速度。DPoS机制要求在产生下一个区块之前,必须验证上一个区块已经被受信任节点所签署。相比于PoS的“全民挖矿”,DPoS则是利用类似“代表大会”的制度来直接选取可信任节点,由这些可信任节点(即见证人)来代替其他持币人行使权力,见证人节点要求长期在线,从而解决了因为PoS签署区块人不是经常在线而可能导致的产块延误等一系列问题。DPoS机制通常能达到万次每秒的交易速度,在网络延迟低的情况下可以达到十万秒级别,非常适合企业级的应用。因为AAA和GXS对于数据交易频率要求高,更要求长期稳定性,因此DPoS是非常不错的选择。在此项目上二者的共识基本一致。
AAA相对于GXS的原生性优势在于,他致力于解决区块链大数据类项目需要解决的三大核心问题:
1) 解决数据确权和权益保护问题
AAA和GXS都通过区块链的分布式账本,能够安全透明地记录所有数据上传、更新、交易或使用行为,这些行为记录一经确认就不可被篡改,使得开放平台上的所有数据具有可确权、可溯源的功能。AAA使用统一数字身份对用户在网络上多个设备多个场景的不同身份进行统一映射。可以用于用户数据的跨屏跨应用合并,及统一登录。用户的个人数据完全由用户所有,用户完全掌握私钥,并由用户自己决定向谁开放授权以及如何收费,全程可跟踪。GXS的做法则是首先用户要创建自己在布洛克城的居民身份并通过KYC,之后凭着自己上传的数据来挖矿。
2) 解决用户隐私保护问题
AAAChain采用统一用户数字身份,平台为每个用户生成一套非对称加密的公钥和私钥,私钥只有用户个人能访问。用户个人数据经公钥签名写入,仅拥有私钥的人可以查看原始数据,私钥意味着数据的唯一控制权。公信宝采用类似的方式,不过会要求用户上传一些私人信息来获得挖矿权利,在这个工程中对支付宝、京东账户的采集会导致“异地登陆”的行为的出现,并且会采集你的支付记录,风险较大。
3) 解决数据结构化存储与数据质量保证问题
数据交易的⼀个普遍难点是数据的结构化, AAAChain数据开放平台采⽤统⼀的数据分类。对⽤户的数据分类主要是从⼈⼝属性,商业属性, App行为等维度划分。
1人口属性:性别,年龄,地域,职业,婚姻状况,小孩等。
2商业属性:消费等级,消费周期等。
3 App行为:浏览,搜索,下单,发表,点赞,客服投诉等
GXS则采用数据授权的方式,每授权一项数据都会返还一个相对应的Hash ID,用户在公信宝Dapp中可以看到上链的数据. 后期,用户可以在区块链浏览器上查询用户的个人数据。同时,其他人也可以根据这个Hash ID可以在浏览器上查询加密后的内容。比较来看,GXS在数据结构化存储方面要弱于AAA,而这恰恰是商业应用中数据使用者最关心的问题,只有高质量的数据才能发挥其实际价值。希望GXS开发者能意识到此问题并在后续版本中有所改进。
对于大数据平台来说,最核心的资源就是数据。目前GXS要求用户授权的信息,会在公信宝进行画像生成和零知识证明后以加密的模式存入ipfs。在HASH算法未被破解之前,我们可以有理由相信,存入区块链的数据是可信的和被保护的。但是,产生画像的过程中,公信宝任然采取了中心化的方式进行数据处理,区块链最大的特点:用算法保障数据可靠性这一点,出现了漏洞。另一方面,在2B领域,公信宝对数据交易所的切入非常的明确和清晰。但在2C领域的切入,GXS虽然已经有不少KYC方面的合作,但对代币的应用还没有给出比较明确的循环路径,也是一个潜在的问题。
显而易见,第三代区块链的大数据生态会逐渐普及,现在这个领域还未像区块链公链一样竞争激烈。AAA和GXS,是国内在区块链结合大数据领域的领头项目,作为投资的角度,长期来看,大数据作为下一代区块链最容易落地的方向,值得关注。
参考阅读:
20160409 区块链:一个让数据真正属于用户的技术架构
20180211 AAAChain:数据共享经济的引擎?
20180214 公信宝与区块链
20180226 阿里王坚:区块链与数据价值的交换
20180312 区块链和数据安全:减轻风险的方法
20180416 【白皮书】公信宝:第一个面向大众的个人端区块链应用
20180516 你的数据价值超乎想象——浅述区块链数据安全与权益划分
《GXS whitepaper》
《AAA whitepaper》
责编:汉网