查看: 14824|回复: 15

[原创] 感觉R语言对中文支持的能力还好,有遇到乱码的筒子么

  [复制链接]
论坛徽章:
1
R研习者初级
日期:2012-09-17 19:50:38
发表于 2012-9-24 11:56 | 显示全部楼层 |阅读模式

单选投票, 共有 5 人参与投票

投票已经结束

20.00% (1)
60.00% (3)
0.00% (0)
20.00% (1)
您所在的用户组没有投票权限
回复

使用道具 举报

新浪微博达人勋 askyer  未实名认证
论坛徽章:
36
Hadoop研习者初级
日期:2012-08-20 22:35:19C++徽章
日期:2014-11-06 17:46:08storm徽章
日期:2015-01-08 14:37:20机器学习徽章
日期:2015-03-02 18:03:10R研习者中级
日期:2015-04-10 15:21:17LATEX徽章
日期:2015-05-07 11:34:18Java徽章
日期:2015-07-29 15:04:13数据陷阱解读徽章
日期:2015-08-13 15:21:46Datastage徽章
日期:2015-12-10 16:03:48Docker徽章
日期:2016-01-21 11:55:16Hadoop研习者初级
日期:2016-02-01 16:30:08技术内幕徽章
日期:2016-03-03 14:48:37
发表于 2012-9-24 13:16 | 显示全部楼层
貌似没遇到,遇到的发表一下来
回复

使用道具 举报

论坛徽章:
15
R研习者初级
日期:2012-05-11 22:09:45scala徽章
日期:2014-11-06 14:56:26kettle徽章
日期:2014-11-06 14:46:10R研习者中级
日期:2014-09-19 14:19:45R研习者中级
日期:2014-09-19 14:18:27Hadoop研习者中级
日期:2014-09-19 14:13:17Hadoop研习者中级
日期:2014-09-19 14:12:58Oracle研习者高级
日期:2013-08-25 14:23:35R研习者中级
日期:2013-06-13 19:02:32nosql徽章
日期:2013-05-09 17:05:06Openstack徽章
日期:2013-05-09 17:03:52R研习者中级
日期:2013-01-11 14:59:01
发表于 2012-9-24 13:28 | 显示全部楼层
window 一般是gbk的编码,读取utf-8的文件时,需要声明读取编码就OK了。 source(file,encoding="utf-8")

linux的情况复杂一些
1. locale要设置成zh_CN
2. 要安装中文字符集,或者从window下复制过去
3. R读取,统一用utf-8的。

最复杂的情况是DB连接
1. 有时候DB的字符集是gb2312, gbk, utf8等
2. 在DB读取的时候,DBI包,要设置DB的字符编码
3. 当把数据读到R中时,要跟R的环境的编码要统一
4. linux/win两套环境,编码部分要是区别写的。

回复

使用道具 举报

论坛徽章:
15
R研习者初级
日期:2012-05-11 22:09:45scala徽章
日期:2014-11-06 14:56:26kettle徽章
日期:2014-11-06 14:46:10R研习者中级
日期:2014-09-19 14:19:45R研习者中级
日期:2014-09-19 14:18:27Hadoop研习者中级
日期:2014-09-19 14:13:17Hadoop研习者中级
日期:2014-09-19 14:12:58Oracle研习者高级
日期:2013-08-25 14:23:35R研习者中级
日期:2013-06-13 19:02:32nosql徽章
日期:2013-05-09 17:05:06Openstack徽章
日期:2013-05-09 17:03:52R研习者中级
日期:2013-01-11 14:59:01
发表于 2012-9-24 13:28 | 显示全部楼层
不过,基本上都能解决,要花点时间!
回复

使用道具 举报

论坛徽章:
1
R研习者初级
日期:2012-09-17 19:50:38
 楼主| 发表于 2012-9-28 00:30 | 显示全部楼层
版主看来确实编码高手,见多识广
回复

使用道具 举报

论坛徽章:
6
spss初级
日期:2012-10-11 16:17:06EBS财务徽章
日期:2013-05-09 13:13:47EBS制造徽章
日期:2013-05-09 13:15:37python徽章
日期:2013-05-09 13:21:16Oracle研习者高级
日期:2013-08-25 14:24:54树莓派
日期:2014-09-19 15:22:08
发表于 2012-9-29 01:34 | 显示全部楼层
路径名较好不要包含中文,就这点
回复

使用道具 举报

新浪微博达人勋 zhlight  未实名认证
论坛徽章:
15
R研习者初级
日期:2012-05-11 22:09:45数据展示徽章
日期:2016-06-23 11:26:11spss初级
日期:2015-12-24 15:56:30cognos徽章
日期:2015-10-14 17:39:01数据陷阱解读徽章
日期:2015-08-13 15:21:45树莓派
日期:2015-07-09 11:12:59Excel徽章
日期:2015-05-14 10:37:05比特币徽章
日期:2014-11-06 14:53:58R研习者中级
日期:2014-09-19 14:21:06R研习者中级
日期:2014-09-19 14:17:27R研习者中级
日期:2013-06-13 19:02:32EBS财务徽章
日期:2013-05-09 13:13:47
发表于 2012-9-29 10:29 | 显示全部楼层
cruiser 发表于 2012-9-29 01:34
路径名较好不要包含中文,就这点

路径名除了不要中文外,较好也不要空格(如:Program Files (x86)),否则以后生成R安装包时,也会出现很多问题。
回复

使用道具 举报

论坛徽章:
12
R研习者初级
日期:2012-09-17 19:50:38测试徽章
日期:2015-05-28 11:33:41测试徽章
日期:2015-05-14 10:16:29测试徽章
日期:2015-05-07 11:08:11Openstack徽章
日期:2014-12-25 16:03:43Oracle研习者中级
日期:2013-12-17 23:15:04Openstack徽章
日期:2013-05-09 17:03:52python徽章
日期:2013-05-09 13:21:16Oracle研习者初级
日期:2013-03-16 21:09:06redis徽章
日期:2017-05-18 16:17:50
发表于 2012-9-29 11:32 | 显示全部楼层
bsspirit 发表于 2012-9-24 13:28
window 一般是gbk的编码,读取utf-8的文件时,需要声明读取编码就OK了。 source(file,encoding="utf-8")

...

都不知道GBK,2312那些编码除了小以外还有什么优点;;一般都是设置UTF8了。
回复

使用道具 举报

论坛徽章:
15
R研习者初级
日期:2012-05-11 22:09:45scala徽章
日期:2014-11-06 14:56:26kettle徽章
日期:2014-11-06 14:46:10R研习者中级
日期:2014-09-19 14:19:45R研习者中级
日期:2014-09-19 14:18:27Hadoop研习者中级
日期:2014-09-19 14:13:17Hadoop研习者中级
日期:2014-09-19 14:12:58Oracle研习者高级
日期:2013-08-25 14:23:35R研习者中级
日期:2013-06-13 19:02:32nosql徽章
日期:2013-05-09 17:05:06Openstack徽章
日期:2013-05-09 17:03:52R研习者中级
日期:2013-01-11 14:59:01
发表于 2012-9-29 11:44 | 显示全部楼层
windelk 发表于 2012-9-29 11:32
都不知道GBK,2312那些编码除了小以外还有什么优点;;一般都是设置UTF8了。

winxp默认是gbk,这就很麻烦

gb2312是遗留问题,网易现在还好一些网页是gb2312的呢。
回复

使用道具 举报

论坛徽章:
0
发表于 2012-9-29 15:13 | 显示全部楼层
碰到太多这样的编码问题,我用python解决,然后用R,我的环境debian+R
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

 

GMT+8, 2017-9-27 05:33 , Processed in 0.132997 second(s), 63 queries .

关闭

扫一扫加入
本版微信群