查看: 100518|回复: 164

新的起点——dataguru建站公告——2011.12.28

  [复制链接]
论坛徽章:
6
spss初级
日期:2012-10-11 16:17:06EBS财务徽章
日期:2013-05-09 13:13:47EBS制造徽章
日期:2013-05-09 13:15:37python徽章
日期:2013-05-09 13:21:16Oracle研习者高级
日期:2013-08-25 14:24:54树莓派
日期:2014-09-19 15:22:08
发表于 2011-12-28 23:35 | 显示全部楼层 |阅读模式
2011年12月28日,dataguru数据分析专业社区正式成立。

近年来,由于存储设备的单位成本以惊人的速度下降(1G硬盘空间的成本现在只需要几美分,这在过去难以想象),我们可以轻而易举地积累起大量的数据。电信运营商,可以记录用户通话、短消息、无线上网产生的每一条信令,省级运营商一小时写入存储设备的数据量可以达到几百G。电子商务网站,可以记录用户的每一次交易,甚至每一次点击,可以复原用户的完整访问路径找出用户的兴趣点。城市监控体系,在各个重要路口,高速公路上的摄像头,每秒钟都在产生海量的视频数据。在生命科学领域,对人体的DNA分析,一个个体就能产生几个G数据,可以想象如果一个生物信息数据库里包含了成千万的个体数据,信息量将会是怎样一个规模,如此等等,不胜枚举。我们毫无疑问,正处于一个信息爆炸的时代。

很不幸的是,我们得到了大量的数据,而这些数据中的绝大部分,在它的生命周期里基本上都被闲置着,从来没有考虑过产生任何的价值,唯一的用途就是“保存备查”。尽管“啤酒与尿布”的故事,已经写入教科书有10多年了,几乎每一个接受过专业教育的同仁都知道数据挖掘能产生的价值,但是直到今天,我们对数据的处理依然停留在按预定指标进行统计这种很低的水平上。造成这种情况的原因有很多。一方面,由于业务人员和IT人员的工作鸿沟,使到即使能提出数据分析的需求都成了一个很大的困难。在各公司里保管数据的大多是IT人员,他们对业务的了解可能并非很深入,而业务人员也鲜有对数据有深入认识者,他们通常都缺乏必要的数学素质和知识基础去进行建模和深入的分析工作。另一方面,数据分析专家具有深厚的数学处理能力,善于建模和构筑算法,但是由于无法得到合适的需求,他们的能力也无从施展。另外数学家、统计学家们很多并不熟悉现代的IT软硬件设备的特性,对于集群、分布式系统、大规模存储、云计算、数据库等认识几乎为零,对于算法的实现可能还停留在对着PC写C语言程序的水平上,对于海量数据,无法利用现代化设备的能力,使到算法是否能真正实现变成生产力存有很大的疑问。

Dataguru网站成立的目标,正是要打破这种鸿沟。用新兴的社交网站的形式,把各应用领域的业务专家、数据分析专家、IT专家以及这些领域的从业人员,学习者等等关联起来,使到他们能高效率的沟通交流知识,使企业和用户能在他们保存的海量数据中寻找出价值。由于这个目标犹如前人炼石成金,于是我给这个网站起了个也许不是很贴切的中文名字叫“炼数成金”。期待数年之后,“炼数成金”成为中国数据分析行业从业人员的主要集散地,黄埔军校,成为中国首个具备重要影响力的主流数据分析类网站。

感谢中山大学海量数据与云计算研究中心提供的专业意见支持,感谢广州皓岚信息技术有限公司提供服务器平台、带宽以及网站技术服务,感谢所有支持dataguru发展壮大的朋友们!


FAQ(不断增加中)

问:dataguru讨论什么?是数学,IT,产品工具,还是具体业务?
答:dataguru讨论的是以业务作为主线索的数据分析,包括“需求产生-建立数据仓库-数学建模-设计算法-算法实现-结果展现”整个链条,核心价值是为业务产生经济效益。由于数据分析领域是一个交叉学科,所以我们在讨论过程里不可避免地会涉及数学知识、IT软硬件产品和平台使用等,所以这些也被纳入到我们的讨论范畴

问:商业数据通常具备敏感性,在这里讨论安全吗?
答:dataguru是一个开放的网站,所有讨论的内容都向全世界公开。因此提醒所有会员注意你在这里所发表的东西最好不要涉及贵公司的机密。要做到这点,首先我们可以私下讨论,或者在不提及具体数据的情况下,经过包装的手段后在网站上进行公众讨论。对于基于dataguru进行的任何咨询、培训业务,官方都会遵循行业保密规范,在法律层面上对用户和客户的商业秘密负有保护的责任。

问:我想加入dataguru的管理团队(成为版主)和专家团,有什么途径?
答:任何朋友,只要具备相应版块的专业知识,具有分享精神,有为网友服务的热情和恒心,时间又能保证的,可以随时提出申请。申请可用站内信发给网站管理员仙豆和岸岸两位,我们一般会在一周内给予答复。Dataguru的专家团由数据分析专家,专家和各应用领域的专家组成,具有dataguru顾问团的职能,为网站的业务和发展提供指导意见,或者参与dataguru的某些业务,有兴趣加入我们团体的朋友可用站内信或邮件联系管理员cruiser,感谢支持
回复

使用道具 举报

论坛徽章:
2
R研习者中级
日期:2014-09-19 14:17:27spss初级
日期:2015-12-24 15:56:30
发表于 2011-12-30 15:26 | 显示全部楼层
支持!
回复 支持 反对

使用道具 举报

论坛徽章:
4
spss初级
日期:2012-10-11 16:17:06nosql徽章
日期:2013-05-09 17:05:06scala徽章
日期:2014-11-06 14:55:58推荐系统徽章
日期:2015-03-12 11:29:01
发表于 2011-12-30 15:50 | 显示全部楼层
欢迎更多专家加入。
回复 支持 反对

使用道具 举报

论坛徽章:
0
发表于 2011-12-30 17:54 | 显示全部楼层
Fully support.

secooler
回复 支持 反对

使用道具 举报

论坛徽章:
2
spss初级
日期:2015-12-24 15:56:30DB2徽章
日期:2016-04-07 10:58:04
发表于 2011-12-30 17:58 | 显示全部楼层
支持! 同时欢迎专家们的加入!
回复 支持 反对

使用道具 举报

论坛徽章:
0
发表于 2011-12-30 18:32 | 显示全部楼层
支持一下,希望建设成为DW的绝佳论坛。
回复 支持 反对

使用道具 举报

论坛徽章:
0
发表于 2011-12-30 21:14 | 显示全部楼层
我们要成为什么?渠道?平台?技术中心?
大量数据里也有大量的垃圾数据,有用的数据不到百分之一,有效的数据不到千分之一…………
回复 支持 反对

使用道具 举报

论坛徽章:
6
spss初级
日期:2012-10-11 16:17:06EBS财务徽章
日期:2013-05-09 13:13:47EBS制造徽章
日期:2013-05-09 13:15:37python徽章
日期:2013-05-09 13:21:16Oracle研习者高级
日期:2013-08-25 14:24:54树莓派
日期:2014-09-19 15:22:08
 楼主| 发表于 2011-12-30 21:36 | 显示全部楼层
lastwinner 发表于 2011-12-30 21:14
我们要成为什么?渠道?平台?技术中心?
大量数据里也有大量的垃圾数据,有用的数据不到百分之一,有效的 ...

还是交流平台为主,也可以考虑组织起来解决一些项目

数据分析,数据挖掘正是要在大量的垃圾里炼出金子出来:lol
回复 支持 反对

使用道具 举报

论坛徽章:
0
发表于 2011-12-31 00:14 | 显示全部楼层
支持支持
回复 支持 反对

使用道具 举报

论坛徽章:
0
发表于 2011-12-31 03:44 | 显示全部楼层
顶~
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

 

GMT+8, 2017-8-17 05:26 , Processed in 0.158601 second(s), 54 queries .