博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《数据科学:R语言实现》——2.5 使用Excel文件
阅读量:6345 次
发布时间:2019-06-22

本文共 1082 字,大约阅读时间需要 3 分钟。

本节书摘来自华章出版社《数据科学:R语言实现》一 书中的第2章,第2.5节,作者:R for Data Science Cookbook 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.5 使用Excel文件

Excel是另一种存储和分析数据的常用工具。当然,我们可以把Excel文件转化为CSV文件或者其他文件格式。你也可以在R中安装加载xlsx程序包,来读取和处理Excel数据。

准备工作
在本教程中,你需要给开发环境安装R,同时确保计算机可以访问互联网。
实现步骤
执行下列步骤,读取Excel文档。
1.首先,安装加载xlsx程序包:
screenshot
screenshot

运行原理

在本教程中,我们介绍了如何使用xlsx程序包读取和写入包含世界经济指标的Excel文件。首先,我们需要安装加载xlsx程序包。它允许用户通过R命令,使用Java POI包,读取和写入Excel文件。因此,要使用Java POI包,我们也需要同时安装rJava和xlsxjars。你可以在libraryxlsx]jarsjava下找到Java POI的.jar文件。以作者的计算机为例,它安装了Windows 7操作系统,.jar文件位于C:Program FilesRR-3.2.1libraryxlsxjarsjava路径下。
然后,我们使用函数download.file从链接 data.worldbank.org/topic/economy-and-growth下载世界经济指标数据。download.file默认下载文件为ASCII编码。要下载二进制文件,我们需要设定下载模式为wb。
下载Excel文件之后,我们可以使用Excel查看。Excel文件的截图说明经济指标从第1页的第4行开始。因此,我们可以使用函数read.xlsx2从这个位置读取数据。xlsx程序包提供了两个函数来读取Excel中的数据:read.xlsx和read.xlsx2。因为函数read.xlsx2主要处理Java中的数据,因此read.xlsx2的性能要好些(特别的,read.xlsx2在处理多于100000个数值的数据集时相当快)。
当把工作单的内容都读取到R的数据框后,我们可以从R数据框中选取变量Country.Name、Country.Code、Indicator.Name、Indicator.Code和X2014,然后使用函数dim查看数据框的维度。最后,我们可以使用write.xlsx2把转换后的数据写入一个Excel文件2014wbdata.xlsx中。

转载地址:http://mrjla.baihongyu.com/

你可能感兴趣的文章
类继承的结构
查看>>
Intel 被 ARM 逼急了
查看>>
testng + reportng 测试结果邮件发送
查看>>
神操作:如何将Vim变成一个R语言IDE
查看>>
百度亮相iDASH,推动隐私保护在人类基因组分析领域的应用
查看>>
比特币暴涨拉升至1w美元以上,说比特币崩盘的专家要失望了
查看>>
Python「八宗罪」
查看>>
你的隐私还安全吗?社交网络中浏览历史的去匿名化
查看>>
NeurIPS 2018|如何用循环关系网络解决数独类关系推理任务?
查看>>
Windows 10 份额突破 40%,Windows 7 连跌四月终回升
查看>>
怎么把Maven项目转为动态Web项目?
查看>>
Arm发布Cortex-A76AE自动驾驶芯片架构,宣示车载系统市场主权
查看>>
FreeBSD ports中make可带有的参数(转)
查看>>
Hibernate入门教程
查看>>
Java支付宝扫码支付[新]
查看>>
SpringMVC 拦截器 筛选
查看>>
CronExpression介绍
查看>>
第十八章:MVVM(八)
查看>>
点击表头切换升降序排序方式
查看>>
第26天,Django之include本质
查看>>