摘要:
监督学习的主要目的是使用有类标(label)的训练(training)数据构建模型,我们可以使用经训练得到的模型对未来数据进行预测。此处,术语监督是指训练数据集中的每个样本均有一个已知的输出型。监督学习一般使用离散的类标(class label),被称为分类。监督学习的另一个子类是回归(regres 阅读全文
摘要:
结构化数据与非结构化数据: 结构化:可以用二维表表示的数据,存储在数据库里面的 非结构化数据:包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等 办结构化:介于其中间 机器学习按输入数据分可以分结构化数据(表),半结构化数据(文本,日志等),非结构化数据(图片, 阅读全文