Tablesaw——Java统计、机器学习库
资源
java二维数组处理可可视化库
https://github.com/jtablesaw/tablesaw
plotly JS库的Java封装
https://github.com/jtablesaw/plotly.java
概述
Tablesaw是一个二维数组和数据可视化库,支持加载、清理、转换、过滤和汇总数据。如果使用Java处理数据,它可能会节省您的时间和精力。Tablesaw还支持描述性统计,可为集成机器学习库(如Smile、Tribo、H20.ai和DL4J)准备数据。
特点
数据处理
- 从关系型数据库, Excel, CSV, TSV, JSON, HTML, or 固定宽度的文本文件中导入数据, 支持本地和远程数据 (远程数据获取方式:http, S3, 等)
- 导出数据到 CSV, JSON, HTML or Fixed Width files.
- 追加、联合来合并表格
- 添加或移除行、列
- 排序、分组、过滤、编辑、转换等
- Map/Reduce 操作
- 处理缺失数据
数据可视化
对Plot.ly JS库的封装,提供可视化。
统计
描述性统计:mean 平均值, min 最小值, max 最大值, median 中值 中位数, sum 总和, product 乘积, standard deviation 标准差, variance 方差, percentiles 百分位, geometric mean 几何平均值, skewness 偏度, kurtosis 峰度
使用
maven引入
<dependency>
<groupId>tech.tablesaw</groupId>
<artifactId>tablesaw-core</artifactId>
<version>VERSION_NUMBER_GOES_HERE</version>
</dependency>
使用其他功能,引入相应的包
- tablesaw-beakerx - 在BeakerX中使用 Tablesaw
- tablesaw-excel - 使用Excel 工作簿
- tablesaw-html - 使用HTML
- tablesaw-json - 使用JSON
- tablesaw-jsplot - 创建统计图表
作者:马洪彪
出处:http://www.cnblogs.com/mahongbiao/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。