Spark GraphX 2

顶点:VertexRDD
 
边:EdgeRDD、Edge、EdgeDirection
 
Triplet:EdgeTriplet
 
存储:PartitionStrategy
通常的存储方式有两种:切边或切顶点,GraphX用的是切顶点,有四种存储方式:
EdgePartition2D
EdgePartition1D
RandomVertexCut(自由分布)
CanonicalRandomVertexCut(定向分布)
有四种table:Vertex Table、Routing Table、Edge Table
 
Graph:Graph、GraphImpl、GraphOps
引进Google公司的图引擎构建的GraphOps
GraphOps中调用图计算引擎Pregel实现了PageRank、SVDPlusPlus、TriangleCount等算法
Pregel:并行图计算系统
Graph是一个抽象类,它的具体实现是有GraphImpl实现的
 
通过外部数据加载构成一张图:GraphLoader
posted @ 2015-11-26 14:33  sunflower627  阅读(399)  评论(0编辑  收藏  举报