查看: 349|回复: 0

Spark MLlib学习——综述和Pipeline(转载)

[复制链接]
论坛徽章:
45
Go徽章
日期:2019-01-17 15:22:50Hadoop研习者初级
日期:2018-04-20 15:30:13pyspark徽章
日期:2018-04-08 16:26:31Hadoop研习者中级
日期:2018-04-02 15:22:57python徽章
日期:2018-03-23 10:45:53计算徽章
日期:2018-03-19 15:04:31Tensorflow徽章
日期:2018-03-01 16:44:34金融徽章
日期:2018-03-01 16:43:15时间序列分析徽章
日期:2018-02-08 16:18:26Julia徽章
日期:2017-12-25 17:39:24spark徽章
日期:2018-06-14 15:36:26知识图谱徽章
日期:2018-06-15 13:47:21
发表于 2018-6-10 23:00 | 显示全部楼层 |阅读模式

工具 算法 机器学习 Spark MLlib

https://www.jianshu.com/p/27db1f14e21a

MLlib是Spark的机器学习lib,目的是让机器学习的实践变得更加简单,总的来说它提供了以下几种工具:

ML算法:分类、回归、聚类和协同过滤等常用学习算法

特征工程:特征提取、转换、降维和选择

Pipelines:创建、评价和调优的ML Pipelines工具

存储:保存和加载算法、模型和Pipeline

实用工具:线性代数、统计、数据处理等

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

 

GMT+8, 2019-2-22 05:55 , Processed in 0.134754 second(s), 29 queries .