查看: 1364|回复: 3
打印 上一主题 下一主题

怎么看待和比较MLlib和Mahout?

[复制链接]
论坛徽章:
10
Oracle研习者初级
日期:2016-04-14 10:44:11Hadoop研习者初级
日期:2017-07-06 17:16:09Oracle研习者高级
日期:2017-06-15 17:32:25Oracle研习者中级
日期:2017-03-16 18:00:30nosql徽章
日期:2017-03-02 16:36:54技术内幕徽章
日期:2016-12-08 15:37:48数据治理徽章
日期:2016-07-28 10:57:38Oracle研习者中级
日期:2016-07-21 11:38:22Excel徽章
日期:2016-07-14 11:18:34mysql徽章
日期:2017-11-23 17:01:08
跳转到指定楼层
1#
发表于 2017-6-19 11:28 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

MLlib Mahout

分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
收藏收藏 分享分享 支持支持 反对反对 分享到新浪微博
回复

使用道具 举报

论坛徽章:
10
Oracle研习者初级
日期:2016-04-14 10:44:11Hadoop研习者初级
日期:2017-07-06 17:16:09Oracle研习者高级
日期:2017-06-15 17:32:25Oracle研习者中级
日期:2017-03-16 18:00:30nosql徽章
日期:2017-03-02 16:36:54技术内幕徽章
日期:2016-12-08 15:37:48数据治理徽章
日期:2016-07-28 10:57:38Oracle研习者中级
日期:2016-07-21 11:38:22Excel徽章
日期:2016-07-14 11:18:34mysql徽章
日期:2017-11-23 17:01:08
2#
 楼主| 发表于 2017-6-19 11:28 | 只看该作者
这两个都是Apache下的项目,并且都是机器学习算法的是实现,现在也都是向着Spark的了。是不是有点多余?他们到底有什么区别和优劣呢?
回复 支持 反对

使用道具 举报

论坛徽章:
10
Oracle研习者初级
日期:2016-04-14 10:44:11Hadoop研习者初级
日期:2017-07-06 17:16:09Oracle研习者高级
日期:2017-06-15 17:32:25Oracle研习者中级
日期:2017-03-16 18:00:30nosql徽章
日期:2017-03-02 16:36:54技术内幕徽章
日期:2016-12-08 15:37:48数据治理徽章
日期:2016-07-28 10:57:38Oracle研习者中级
日期:2016-07-21 11:38:22Excel徽章
日期:2016-07-14 11:18:34mysql徽章
日期:2017-11-23 17:01:08
3#
 楼主| 发表于 2017-6-19 11:28 | 只看该作者
知道点spark和Hadoop,但不是机器学习这方向的,个人观点:spark适合多次迭代的计算,比如机器学习和图计算,因为数据可以存放在内存中,这样每次迭代就不会像Hadoop那样去从HDFS上取数据了,当让你也可以用Hadoop的分布式缓存,但是单个节点内存需求较大。不过现在的mahout已经不再接受mapreduce的作业了,转而接受spark的job,以后会变得差不多。

作者:egral
链接:https://www.zhihu.com/question/26229402/answer/32962093
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
回复 支持 反对

使用道具 举报

论坛徽章:
4
Hadoop研习者初级
日期:2017-07-06 17:16:09金融徽章
日期:2017-07-11 14:28:40python徽章
日期:2017-09-22 16:52:37Hadoop研习者初级
日期:2018-01-11 17:33:01
4#
发表于 2017-6-22 17:32 | 只看该作者
谢谢楼主分享,学习了
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

 

GMT+8, 2019-6-24 21:46 , Processed in 0.116682 second(s), 34 queries .