那些存储在云上的数据真的安全吗?未来的云服务将会是这样的

在这个信息爆炸的时代,数据存储与我们每一个人息息相关。从打孔卡到软盘硬盘再到中心化云端存储服务,人类在寻求更便捷有效的数据存储方式的道路上从未停下过脚步。未来会出现比如今最流行的中心化存储服务更便宜,更高速,更隐私的服务吗?在后续的文章中,将会从当今市场所出现的问题入手,带大家一起慢慢领略去中心化存储的魅力所在。

 

存储市场有多大?

当我们谈及某个特定市场时,规模和发展趋势必定是最重要的两点。从上图来看,截止到2020年, 预估硬盘总出货量达到1120 EB 且一直保持着上升的趋势。那么,如此庞大的市场,现在存在着什么样的问题呢?

当前市场最大的问题是什么?

在此,首先要介绍一下存储这个行业。存储分为企业存储和个人存储两部分。企业存储,最好的例子是 AWS 的 S3 和阿里云的 OSS。而个人存储,就是大家熟悉的用于备份和同步功能的网盘,例如微软的 Onedrive,苹果的 iCloud,谷歌的 Google Drive,还有第三方公司的 Dropbox。

不论是企业服务还是个人服务,最流行的还是中心化方案。商家自己建立数据中心,购买带宽,采购机器,部署软件,从而搭建起一个完整的服务产品,这就是所说的中心化存储。

中心化存储虽然流行,但并不完美,它有以下几个问题。

  1. 中心化存储,拥有明确的中心,安全成本高昂,且更容易被攻击。众所周知,对黑客而言,只要攻破了这个明确的中心,就可以拿到所有的数据,甚至篡改。

  2. 对于实力不足的运营方而言,有随时终止服务的风险。之前中国流行过一段时间的网盘大战,而且这还不是由创业公司直接发起的价格大战,参战方有360网盘,金山网盘,新浪微盘,百度网盘等。几年过去了,大部分的网盘业务都已经关闭,大量用户的存储数据丢失。

  3. 个人数据不再被个人所拥有,反之,平台方拥有所有的数据。部分平台方为了出于自身的利益考虑,会将这些数据用作 AI 深度学习的训练数据样本,最终在其他领域谋取利益。而这些数据在变相分析后,拥有一定的商业价值。商家可以运用这些数据进行用户画像分析,从而精确指导用户的行为习惯和心里推演,最终诱导用户购买商品,从而产生价值。因此,只要把数据放在中心化的地方,那么用户的数据权利就一定得不到最终保证。

  4. 存在个人隐私数据被审查的风险。首先,我们认为违法数据的审查有利于社会和经济的安定。但是对审查方而言,在审查的时候,由于并不确定什么数据是违法的,什么数据是没有问题的,只有把所有的数据全部审查一遍,这导致了不论是否有问题的数据都会被审查,也势必影响合法用户的合法隐私数据被看到,甚至被泄露的可能性。

  5. 带宽传输成本非常高昂。注意,我这里说的是带宽,不是存储。无论上传数据还是下载数据都会消耗带宽,所以带宽是不可忽略的,而且比存储成本要贵。而中心化的存储服务,为了保证各个地方的用户都拥有良好的体验,他们会将数据中心部署到主干网络上,而主干网络在任何一个国家都是最贵的。

正因为中心化的存储有这样的问题,所以我们考虑采用去中心化的存储方案来解决。

为什么是去中心化存储?

所谓的去中心化存储,指的不再是搭建数据中心,购买带宽,采购机器和硬盘,而是通过建立一套公正有效且透明的规则,尽可能的去发动全世界所具有的存储能力且有效连入互联网的资源。然后,通过一个大一统的分布式软件体系,将所有的资源都有效地联动起来,在此之上提供一个稳定的服务。这符合 P2P 技术的本质,即在相对不稳定的基础设施上,通过概率法则建立起稳定的服务。

去中心化存储具有哪些优势?

  1. 低廉的传输成本:中心化存储为了保住多个地方的用户体验,只能把服务部署在带宽成本高的主干网节点;而去中心化存储可以充分利用廉价的城域网带宽,甚至是用户端的闲置家庭带宽,这样能够大大降低带宽成本,更具体的内容,参见我之前的文章《为什么 PPIO 的价格能做到比阿里云和 AWS 更低》

  2. 绝对的安全性:去中心化网络和中心化网络的安全机制是不同的,中心化网络安全很依赖于中心化运营方的信用,其核心存储机制也是封闭的,不开源的形式,中心化的运营方机构拥有和用户同样的对数据查看,修改和删除的权限。而去中心化存储的安全机制则不同,是由数学,密码学,以及网络机制共同决定的,其核心存储机制的代码最终也是以开源透明的形式出现。数据的查看,修改,删除由用户的私钥来决定,只要这个私钥不被盗用,数据就是安全的,就像比特币一样,只要私钥不被盗用,所有资金都是安全的。

  3. 永不关停:对于去中心化存储的用户来说,不用担心运营方关停的可能性,因为最终去中心化存储是属于用户的,属于社区的,并不是属于公司的。具体来说, 只要网络能够跑起来,最终其会和比特币一样,以完全开源的形式出现,由于最终是没有中心的,只要还有人愿意部署节点,整个网络就会自动连接所有节点,从而提供有价值的服务网络。

综上,去中心化存储是很有潜力打造的有商业价值的平台。注意,这里提到的有价值,不是指币价被炒得越高,就越有价值;也不是说信仰与共识的多少;而指的是在真实的商业化落地的过程中,由真实需求和满足需求所产生的价值。

正是出于这样的考虑,我们发起了 PPIO 项目,PPIO 是为开发者打造的去中心化存储与分发平台,让数据更便宜、更高速、更隐私。官方网站是 https://pp.io

在此,我说 PPIO 是个平台,那么什么是平台?所谓的平台至少有两个角色,一个是供给,另一个是需求,促成这两个角色之间的匹配并最终形成交易,这就是平台做的事情。并且,平台上的各方能否有序地快速的增长决定了平台的价值。

PPIO 去中心化存储平台有哪些重要的参与者?

在 PPIO 去中心化存储平台上,有三类角色:

  1. 第一类是用户,作为平台的需求侧,他们使用存储服务。

  2. 第二类是矿工,也就是存储节点,作为平台的供给侧,他们提供存储服务,和上传下载产生的带宽服务。

  3. 第三类是服务节点,因为整个平台还需要有些节点来提供特别的,组织性的服务,如索引检索,监督证明,出块,以及执行预言机等。

那么 PPIO 网络的早期应该怎么启动呢?大部分区块链项目都是先靠拉动供给侧启动的。下面我重点分析一下对 PPIO 冷启动的思考。这三类角色是同时拉动?还是早期的时候,先拉动需求侧或者供给侧?

PPIO 冷启动过程是怎样进行的?

既然是平台,就有早期冷启动的策略问题。那么这样的市场早期是适合单边启动,双边启动,还是多边启动呢? 这是个很有意思的问题,我们不妨做个分析。

首先,服务节点在早期冷启动的时候,承载的负载并不多,可以自己部署服务器来承担服务节点的角色。在用户和存储节点上量且软件程序被验证稳定后,可逐步开放给第三方,大家共同部署服务节点。这也是我提出的先强中心,再弱中心,最后去中心的过程。参见文章《PPIO 的三个阶段:“强中心”“弱中心”“去中心”》。所以,服务节点是不需要早期重点运营,设法拉动的。

再讨论用户节点和存储节点,这是个经典的话题,其本质是供给和需求之间的话题。我们先做几个其他互联网平台的分析,抖音,微博,快手都是运用供给侧拉动,他们首先争抢的都是内容的创作端,创作端是个性化,非标准化的,好的内容能带来巨大的价值,这符合他们的商业逻辑,但这些都是供给侧单边拉动的。而京东商城的冷启动,就不是从供给侧而是从需求侧拉动的,因为京东销售数码 3C 等标准化的产品起家的,早期采用的是自主运营,重点把增长的压力放在了用户上,这采用的就是需求侧单边拉动。

对我们 PPIO 去中心化存储平台来说,其出售的商品本质是存储和带宽,除了地域因素以外,其他都是标准化的产品,没有任何创意,也没有特别的部分。所以我们要采用的也是类似京东的策略,即早期采用需求侧单边拉动模式,也就是重点发展用户使用。

其原因不难理解,做个简单的推演。假如我们采用供给侧拉动,但是需求不足,很快矿工们就发现在 PPIO 平台上无法获得稳定持续的收入,那么矿工们就会离开。而换个角度看,如果采用需求侧拉动,早期重点运营用户,用户就会增长;积累大量用户后,整个 PPIO 平台的用量就会实现增长。矿工在 PPIO 平台上提供更多更稳定的服务,从而获取更多更稳定的收益。只有这样矿工才能会安心的在 PPIO 平台中提供服务,而不会停机或者离去。长此以往,供给端将越来越稳定,也将刺激需求端越来越多地使用。最终加速完成冷启动的过程。参见文章《PPIO 是应该先拉动供给,还是应该先拉动需求》

既然这是平台,那么除了早期先拉动需求侧来完成冷启动以外,还要建立起有效的市场机制,即存储租赁市场和带宽租赁市场。在用户和矿工之间的报价中进行匹配和撮合成交。用户希望服务的单价越来越低,矿工则希望服务的单价越来越高,最终希望能够做到分地域的买家(用户)和卖家(矿工)之间的平衡。

现在想象 PPIO 平台已经度过了冷启动的过程,拥有了一定的规模,那么 PPIO 会出现其他互联网平台经常遇到的问题吗?后面我将详细分析这一部分。

PPIO 平台可能会遇到哪些困境?

首先说一下其他互联网平台在做大后可能会遇到哪些问题。将淘宝作为例子,其出现过以下几个问题:

  1. 同侧竞争问题:同一品类的商家之间,产生了激烈的竞争。新入驻的商家在淘宝开店难以做好做大。

  2. 信息过载问题:当商品数量特别庞大之后,用户选择商品非常困难。

  3. 服务质量下降问题:当商品越来越多,经过了激烈的价格竞争之后,商品的质量就越来越难以保证,最后只能通过打假来维持服务质量。

现在我说一下,PPIO 是怎么考虑这些问题的。

1. 同侧竞争问题

主要考虑的是存储节点之间会产生激烈的竞争。其产生的结果是没法把存储跑满,因为在 PPIO 网络中还有价格更低,稳定性更好的存储节点在提供服务。我们的算法在同样的地域,同样的服务承诺情况下(抵押),同样物理结构的硬盘材质上,会优先使用价格更低,稳定性更好的存储节点。我认为这样的算法设计是正确的,因为我们在供给侧提供的是标准化的服务。正是因为算法上会优先保证价格更低,更稳定的存储节点更容易接到单,从而建立起在供给侧的有效竞争模式,促使让存储节点做到更稳定,价格更低。试想一下,这一点不就与今天的比特币类似,如果不是专业的矿场矿工,能拿到非常便宜的电,否则挖比特币一定是亏损的。而驱动这一切的根源其实是相对公平的经济机制。如果后续要获得 PPIO 网络上的订单,就要设法拿到更加便宜的网络,存储和电。

2. 信息过载问题

信息过载问题一般发生在用户侧。其原因是,供给侧越来越多,而 PPIO 平台就会展示给用户越来越多的存储节点,导致用户不知道自己应该选择什么样的存储节点。所以我们将选择机制交给算法来解决。不同的算法可以做出不同的选择逻辑,但去中心化存储的本质是搭建的是一个标准化的服务,技术上我们推荐默认采用类似于证券交易的股票成交撮合机制。即在地域,服务承诺,存储物理结构同等的情况,以价格作为第一选择因素,以过往服务质量作为第二选择因素,这样就能快速做出选择,找到存储节点,自动签订存储合约(也就是成交)。简而言之,PPIO 是通过技术手段,来解决信息过载的问题。

3. 服务质量下降问题

面对前面提到的供给侧的竞争使得 PPIO 平台的存储成交价格越来越低,那么存储节点是否会考虑降低存储质量而降价呢,比如采用劣质廉价硬盘?这也是我们 PPIO 为什么要设计 Token 经济机制的原因。PPIO 的所有交易和服务执行细节最终会在通过证明后,写入区块链上。PPIO 设计了会对未按时完全证明的存储节点进行经济上的惩罚机制。对存储节点而言,如果因为使用坏的硬盘,不好的网络,那么他在完成服务的时候,就会出现问题。存储节点会因为问题而受到惩罚,抵押可能也会被惩罚。对存储节点来说,得不偿失,所以他们会自己想办法去保证服务的质量。简单地说,PPIO 是通过经济机制,来解决存储节点服务质量越来越差问题。

看到这里,各位读者是否对去中心化存储成为有价值商业平台的可行性有了更清晰的了解呢?如果说中心化存储是现行存储服务中的主流,那么去中心化存储必定是将来最有价值的商业平台之一。你,准备好了吗?

想了解更多有关 PPIO 的信息,可以移步官网:pp.io

posted on 2019-06-04 15:28  Omnigeeker  阅读(968)  评论(0编辑  收藏  举报