查看: 175|回复: 0

Spark MLlib学习——综述和Pipeline(转载)

[复制链接]
论坛徽章:
37
R研习者中级
日期:2016-10-20 16:44:19matlab徽章
日期:2017-11-30 15:58:00Kaggle徽章
日期:2017-12-25 17:28:27Kaggle徽章
日期:2017-12-25 17:28:34NLP徽章
日期:2017-12-25 17:31:02Julia徽章
日期:2017-12-25 17:39:24时间序列分析徽章
日期:2018-02-08 16:18:26金融徽章
日期:2018-03-01 16:43:15Tensorflow徽章
日期:2018-03-01 16:44:34计算徽章
日期:2018-03-19 15:04:31python徽章
日期:2018-03-23 10:45:53Hadoop研习者中级
日期:2018-04-02 15:22:57
发表于 2018-6-10 23:00 | 显示全部楼层 |阅读模式

工具 算法 机器学习 Spark MLlib

https://www.jianshu.com/p/27db1f14e21a

MLlib是Spark的机器学习lib,目的是让机器学习的实践变得更加简单,总的来说它提供了以下几种工具:

ML算法:分类、回归、聚类和协同过滤等常用学习算法

特征工程:特征提取、转换、降维和选择

Pipelines:创建、评价和调优的ML Pipelines工具

存储:保存和加载算法、模型和Pipeline

实用工具:线性代数、统计、数据处理等

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

 

GMT+8, 2018-9-21 15:48 , Processed in 0.130562 second(s), 29 queries .