机器学习是一个从数据中获取数据洞察力的过程,通过模型建模应用于数据示例以执行各种高级数据分析任务从而进行数据挖掘获取知识,例如检测数据异常、预测字段值、识别数据模式等。Pandora机器学习工具包提供SPl命令进行机器学习任务探索,使用户可以通过用户界面创建、验证、应用及管理模型。Pandora机器学习工具包原生包含20余种算法,也提供快速扩展算法的能力。
数据准备
在进行机器学习任务前,需要准备好数据。
- 数据收集
需要进行机器学习的任务的数据需要通过Pandora数据接收模块进行数据采集。 - 数据清洗
如果您希望对数据做一些清洗工作,如删除某些字段、过滤某些字段值可通过SPL或者数据集模块进行处理,以便提升数据的质量。
搜索/自定义建模
准备好数据后,需要进入应用平台找到机器学习工具包,点击进入应用进入机器学习应用平台。
您可以在搜索界面进行自定义建模,通过SPL进行模型训练、模型应用。同时,您也可以通过SPL查看所有模型清单、删除模型。
具体命令参数详情可进入SPL机器学习手册查看
机器学习SPL命令 | 描述说明 |
---|---|
fit | 使用某种机器学习算法来拟合数据,以得到某种算法模型的结果 |
apply | 面对一组新数据,运用根据fit命令而得到的某种算法模型的结果来进行预测 |
summary | 返回由fit命令产生的机器学习模型的总结概览信息 |
train_test_split | 随机或顺序划分数据集和测试集 |
score | 使用某种模型评估方式,计算模型的预测效果 |
模型管理
在模型管理界面,提供所有生成模型的列表,您可以进行搜索查看,也可删除模型。
算法管理
在算法管理界面,提供目前支持的算法列表及介绍
关于
在关于界面,展示Pandora机器学习工具包的说明信息。
文档反馈
(如有产品使用问题,请 提交工单)