专家坐堂:R语言下的机器学习与数据分析

[复制链接]
新浪微博达人勋 realure  未实名认证
论坛徽章:
25
nosql徽章
日期:2014-09-19 14:02:41python徽章
日期:2016-08-25 10:57:55python徽章
日期:2016-12-01 17:02:38机器学习徽章
日期:2016-12-08 15:50:25OpenCV徽章
日期:2017-03-10 11:57:27搜索引擎徽章
日期:2017-03-23 17:41:48机器学习徽章
日期:2017-03-30 17:23:20电商分布式系统徽章
日期:2017-04-13 17:37:59Go徽章
日期:2017-12-25 17:16:30Java徽章
日期:2018-02-08 16:11:57Julia徽章
日期:2018-03-08 10:53:12MongoDB徽章
日期:2016-08-18 11:34:42
发表于 2016-7-19 22:50 | 显示全部楼层
白马负金羁 发表于 2016-7-19 20:37
R的强项是统计,它的数学方面的功能非常强,它最初就是为了数据分析而生的。Python 可以做的事情很多,或 ...

谢谢老师{:2_35:}
回复 支持 反对

使用道具 举报

新浪微博达人勋 ryx99  实名认证
论坛徽章:
9
数据陷阱解读徽章
日期:2016-07-14 11:03:41统计徽章
日期:2016-09-08 11:05:56矩阵计算徽章
日期:2016-10-20 17:01:08python徽章
日期:2017-03-30 14:29:16金融徽章
日期:2017-07-11 14:28:40机器学习徽章
日期:2017-09-19 11:01:50Oracle研习者初级
日期:2017-12-28 17:04:46股票徽章
日期:2018-06-29 11:14:50股票徽章
日期:2018-08-30 15:33:52
发表于 2016-7-19 23:28 | 显示全部楼层
左老师您好!
1.统计分析中确实有很多感觉都是偏理论方面的知识,R语言有哪些这方面比较好用的库可以使用吗,请帮助给指点一下,谢谢!
2.在数据挖掘方面,R语言在比如数据赚取、回归分析、关联发现等方面该怎样去做,或者有什么样的案例可以参考。
3.R语言确实是一个功能很强的语言,但感觉确实东西太多,请您帮助给一个学习的导图,尤其是希望在商务智能、数据挖掘等方面进行学习,以便学习的时候不失去方向,
4.想听听在R、Python、Matlab等功能的对比,尤其是今后在商务智能、数据挖掘、机器学习等方面的对比,以便在学习是做更换的选择。
谢谢您的指点!
回复 支持 反对

使用道具 举报

论坛徽章:
14
数据陷阱解读徽章
日期:2016-06-16 10:34:33金融徽章
日期:2018-04-20 15:27:58Excel徽章
日期:2017-11-30 15:59:07Tensorflow徽章
日期:2017-08-03 18:16:28python徽章
日期:2017-03-30 14:29:16python徽章
日期:2016-12-29 16:34:17python徽章
日期:2016-12-22 16:30:21时间序列分析徽章
日期:2016-11-17 16:04:02数据展示徽章
日期:2016-09-08 11:07:46统计徽章
日期:2016-09-08 11:05:56R研习者高级
日期:2016-09-01 10:04:51投资理财徽章
日期:2016-08-25 10:49:04
发表于 2016-7-20 07:50 | 显示全部楼层
左老师请教: R语言是否有比较全的介绍,感觉学的时候一会来一个包,感觉没法遍历的感觉,如要用R做金融量化投资,有比较优秀的参考书或视频教程没,除了蔡先生的金融数据分析导论。
多谢啊!
回复 支持 反对

使用道具 举报

论坛徽章:
14
数据陷阱解读徽章
日期:2016-03-10 10:18:46智慧眼徽章
日期:2018-05-24 16:10:32CUDA徽章
日期:2017-12-25 17:37:49人工智能徽章
日期:2017-07-11 14:26:36机器学习徽章
日期:2017-03-30 17:23:20机器学习徽章
日期:2016-12-08 15:50:25R研习者初级
日期:2016-06-23 11:34:30数据展示徽章
日期:2016-06-23 11:26:11投资理财徽章
日期:2016-05-26 12:12:05R研习者中级
日期:2016-05-26 11:46:43R研习者中级
日期:2016-03-24 11:17:57R研习者中级
日期:2016-03-17 11:34:12
发表于 2016-7-20 09:13 | 显示全部楼层
白马负金羁 发表于 2016-7-19 21:51
NLP(自然语言处理)推荐 python,特别是 python有NLTK这个库非常好用,我在博客上也有介绍很多NLTK的内 ...

谢谢左老师的答疑解惑!
回复 支持 反对

使用道具 举报

论坛徽章:
6
数据陷阱解读徽章
日期:2015-10-29 15:39:29R研习者中级
日期:2016-08-25 10:46:44python徽章
日期:2016-08-25 10:57:55Kaggle徽章
日期:2017-12-25 17:28:19Kaggle徽章
日期:2017-12-25 17:28:27金融徽章
日期:2018-09-13 15:38:56
发表于 2016-7-20 09:27 | 显示全部楼层
你好,如何在R里边查询一些算法呢?比如我想知道哪些包可以做随机森林,主要是这种查询的技巧和方法能不能介绍下
回复 支持 反对

使用道具 举报

新浪微博达人勋 everxjj  未实名认证
论坛徽章:
16
数据陷阱解读徽章
日期:2015-08-13 15:21:46Java徽章
日期:2018-01-04 17:14:48机器学习徽章
日期:2017-12-22 16:00:00机器学习徽章
日期:2017-09-19 11:01:51scala徽章
日期:2017-06-22 17:16:20spark徽章
日期:2017-03-09 16:41:36R研习者高级
日期:2016-12-22 16:15:29python徽章
日期:2016-11-03 17:46:49R研习者初级
日期:2016-06-23 11:34:30数据展示徽章
日期:2016-06-23 11:26:11R研习者中级
日期:2016-03-17 11:32:22spss初级
日期:2015-12-24 15:56:30
发表于 2016-7-20 09:40 | 显示全部楼层
guojichang 发表于 2016-7-20 09:27
你好,如何在R里边查询一些算法呢?比如我想知道哪些包可以做随机森林,主要是这种查询的技巧和方法能不能 ...

我也想问左老师关于随机森林的R包的用法,感觉有太多参数需要调整。如果用随机森林,是不是大部分的预测问题都能比原有的基本预测方法(C5.0决策树,逻辑回归,神经网络等等)更有效呢?
所选的《R语言数据分析、展现与实例》、《SPSS数据分析入门与提高》等课程也没讲这些比较新一点的算法。
回复 支持 反对

使用道具 举报

新浪微博达人勋 realure  未实名认证
论坛徽章:
25
nosql徽章
日期:2014-09-19 14:02:41python徽章
日期:2016-08-25 10:57:55python徽章
日期:2016-12-01 17:02:38机器学习徽章
日期:2016-12-08 15:50:25OpenCV徽章
日期:2017-03-10 11:57:27搜索引擎徽章
日期:2017-03-23 17:41:48机器学习徽章
日期:2017-03-30 17:23:20电商分布式系统徽章
日期:2017-04-13 17:37:59Go徽章
日期:2017-12-25 17:16:30Java徽章
日期:2018-02-08 16:11:57Julia徽章
日期:2018-03-08 10:53:12MongoDB徽章
日期:2016-08-18 11:34:42
发表于 2016-7-20 09:54 | 显示全部楼层
老师好,现在很多数据分析都是千万级以上,但网上有很多文章说R语言做数据分析有瓶颈,超过某个数量级(例如千万级)的时候就不推荐使用R语言了。请问这种情况是否属实呢?如果可以规避,应该采用什么方法来提高R语言规模化分析呢?
回复 支持 反对

使用道具 举报

论坛徽章:
1
R研习者中级
日期:2016-03-17 11:32:22
发表于 2016-7-20 10:35 | 显示全部楼层
夜半三根哟,盼天明~寒冬腊月哟,盼春风~若要盼得哟,红军来~岭上开遍哟,映山红~
一看有大师坐堂,忍不住先唱了一首

对了大师,我最近有几个问题不得其解:
1、如何根据数据框中的一列作为分组,分别计算另外两列的相关系数及显著性检验?比如商户名为分组,计算每个商户三十天的指标A和指标B的相关系数,有1000个商户,每个商户30个历史数据

2、对于相关系数强的,能不能计算一次拟合直线的斜率及R方?

3、如果我感觉两个指标,B对于A在时间上有一定的滞后性,比滞后几天吧,那这个滞后性能不能被什么指标或者模型描述?能不能计算出来这个之后到底是几天?
回复 支持 反对

使用道具 举报

论坛徽章:
3
R研习者中级
日期:2016-03-17 11:32:22R研习者中级
日期:2016-03-17 11:34:12R研习者中级
日期:2016-03-24 11:17:57
发表于 2016-7-20 12:23 | 显示全部楼层

关于R和hadoop结合的问题请问左老师:

目前有一些包(RHadoop、RHive、RSpark),使得用R在Hadoop平台上做数据分析和建模变得容易,但是门槛过高
而且公司要求只能用JAVA写MR建模,所以现在我也改学JAVA了,想请问下老师R和Hadoop结合的就业前景如何?
回复 支持 反对

使用道具 举报

论坛徽章:
0
发表于 2016-7-20 12:28 | 显示全部楼层
ryx99 发表于 2016-7-19 23:28
左老师您好!
1.统计分析中确实有很多感觉都是偏理论方面的知识,R语言有哪些这方面比较好用的库可以使用 ...

1、R中没有所谓库(library)的东西,R中只有各种包(package)。R中的包可能有上万个,总之非常非常多。
2、第二个问题比较大,无法三言两语说完,可以找一些专门的书来参考,不过你可以要把R入门了再说。我的《R语言实战:机器学习与数据分析》可以参考。
3、推荐你看下我的《R语言实战:机器学习与数据分析》,从而对R有一个系统的认识,理论+实战。
4、R和python的对比,之前的回答中已经讲过了,可以往前翻看我的回答:) matlab可以做数据挖掘,它有相关的包,但是并不专业,实际数据挖掘中较少使用。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

 

GMT+8, 2018-9-23 09:22 , Processed in 0.156016 second(s), 65 queries .