查看: 238|回复: 0

Spark MLlib学习——综述和Pipeline(转载)

[复制链接]
论坛徽章:
40
R研习者中级
日期:2016-10-20 16:44:19计算徽章
日期:2018-03-19 15:04:31Tensorflow徽章
日期:2018-03-01 16:44:34金融徽章
日期:2018-03-01 16:43:15时间序列分析徽章
日期:2018-02-08 16:18:26Julia徽章
日期:2017-12-25 17:39:24NLP徽章
日期:2017-12-25 17:31:02Kaggle徽章
日期:2017-12-25 17:28:34Kaggle徽章
日期:2017-12-25 17:28:27python徽章
日期:2018-03-23 10:45:53Hadoop研习者中级
日期:2018-04-02 15:22:57Tensorflow徽章
日期:2018-10-18 15:27:37
发表于 2018-6-10 23:00 | 显示全部楼层 |阅读模式

工具 算法 机器学习 Spark MLlib

https://www.jianshu.com/p/27db1f14e21a

MLlib是Spark的机器学习lib,目的是让机器学习的实践变得更加简单,总的来说它提供了以下几种工具:

ML算法:分类、回归、聚类和协同过滤等常用学习算法

特征工程:特征提取、转换、降维和选择

Pipelines:创建、评价和调优的ML Pipelines工具

存储:保存和加载算法、模型和Pipeline

实用工具:线性代数、统计、数据处理等

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

 

GMT+8, 2018-11-16 21:48 , Processed in 0.086049 second(s), 29 queries .