摘要:
一 基本操作 二 图标辅助参数设置 三 散点图 这个感觉没什么用啊,这颜色就是 随机出来的 呀 这个感觉应用场景比较多,因为按照类别分类很常见。 选择合适的散点 四 直线图和面积图 这里引入了bokeh的数据类型 ColumnColumnDataSource 折线图 p.line / p.multi 阅读全文
摘要:
一 3D_bar 立体动态图标展示 以我目前的水平来看,数据就是一个dataframe。 效果如下图。需要一些辅助工具 CSS,JS,HTML等 二 空间柱状图 1 Excel -- PowerMap 最终效果图如下。加上一个time字段,可以生产动态效果图。 1 原始数据图标,有经度,纬度,两类。 阅读全文
摘要:
一 力导向布局 总结:1 模拟引力和弹力的算法应用,可用于模拟分级分团 2 每次的布局结果可能不一致,与设置和点的分布有关 3 如果有了合适的布局,记住自己的设置 Gephi 1 布局--ForceAtlas 2 选择 防止重叠 2 图的右下方,三角形状图标 。设置 标签(节点),大小(节点大小) 阅读全文
摘要:
差别如下 阅读全文
摘要:
Seaborn是基于matplotlib的Python数据可视化库。 它提供了一个高级界面,用于绘制引人入胜且内容丰富的统计图形。 一 风格及调色盘 风格 1 sns.set() 模式格式 2 sns.set_style() 手动选择样式,从 darkgrid, whitegrid, dark, w 阅读全文
摘要:
一 可视化方向 1 图表可视化进阶(分布?) seaborn 2 交互可视化图表 bokeh 3 关系数据可视化 gephi 4 空间可视化 GIS,echarts,powermap 二 数据可视化技术体系及方向 1 分析图表 2 动态交互 1)echarts 2)百度图说 3 商业技能 1)BDP 阅读全文
摘要:
一 知乎数据清洗整理和数据研究 1 import matplotlib.style as psl plt.style.available psl.use() 2 plt.merge() 这里方法的功能超出我的想象。如果存在两张表,实际上不用对两张表清理的很彻底,就可以用merge方法,将两个表融合在 阅读全文
摘要:
一 线性回归理论概述 回归,指研究一组随机变量(Y1 ,Y2 ,…,Yi)和另一组(X1,X2,…,Xk)变量之间关系的统计分析方法。 from sklearn.linear_model import LinearRegression model = LinearRegression() model 阅读全文
摘要:
一 缺失值处理 1 删除 dropna 2 填充 / 替换 1)用中位数,众数,平均数 2)用临近值替换 fillna / replace 3)lagrange插值法 from scipy.interpolate import lagrange 可以写个函数,实现用lagrange差值 二 异常值处 阅读全文
摘要:
1 分布分析 1 极差 写个函数就行 def d_range(df,*args) 2 定量用直方图 1)直接用plot.hist() 2)s = pd.cut() return indices of half-open bins to which each value of `x` belongs. 阅读全文