炼数成金 商业智能R语言
订阅

R语言

原创翻译 |学习R的最有效的5种方法
原创翻译 |学习R的最有效的5种方法
无论你是打算画一个简单的时序图还是对下次大选建立预测模型,R语言的灵活性都能保证你拥有完成任务所需要的所有特性。本博文我们将探讨学习这门数据科学语言的5个技巧,以及相关的最佳资源。这些技巧将对你掌握这门 ...
原创翻译 | 使用R用动图展示日本老龄化
原创翻译 | 使用R用动图展示日本老龄化
美国人口调查局通过API向开发者开放了他们大量的数据库。其中之一是国际数据库(International Data Base),它是人口调查部门提供的对多个国家历史人口分类统计(通过年龄和性别)的数据库,并且时间是一直延伸到20 ...
R语言可视化——用ggplot构造期待已久的雷达图
R语言可视化——用ggplot构造期待已久的雷达图
之前一直苦恼于ggplot函数无法制作雷达图,心想着既然饼图可以通过柱形图+极坐标模拟出来,为啥雷达图不行。我尝试着用折线图+极坐标来模拟雷达图(之前在制作饼图和圆环图以及玫瑰图的时候就是这样做的)。虽说效果 ...
原创翻译 | 从R转战Python:这些包你一定要知道
原创翻译 | 从R转战Python:这些包你一定要知道
为什么要从R转换到Python? 一个我最喜欢的python的特点是,对于机器学习来说,Python拥有类似R社区的所有优点,并且仿效了它最有价值的地方。我十分信仰这样一种观点,就是一种语言只会因为它拥有的库而变得更加有 ...
原创翻译 | 英国政府使用R来制作现代化官方统计报告
原创翻译 | 英国政府使用R来制作现代化官方统计报告
和所有政府一样,英国政府有义务对官方统计数据以报告的形式进行披露。通常情况下这个过程是完全手工完成的:从政府系统获取数据,在大型机上运行分析工具进行建模和预测,再将结果导出到办公表格软件以便进行展示, ...
R爬虫之上市公司公告批量下载
R爬虫之上市公司公告批量下载
Selenium是一个用于测试网页应用的开源软件。它提供了浏览器中的点击,滚动,滑动,及文字输入等驱动程序。这样,利用Selenium即可以通过脚本程序来替代人工进行测试一个开发软件的各种功能。在处理爬虫任务中,经常 ...
R语言分析《釜山行》人物关系
R语言分析《釜山行》人物关系
《釜山行》是一部丧尸灾难片,其人物少、关系简单,非常适合我们学习文本处理。这个项目将介绍共现在关系中的提取,使用R编写代码实现对《釜山行》文本的人物关系进行分析。使用到的R包library(rvest)library(jiebaR ...
用R语言爬取川普twitter进行数据分析
用R语言爬取川普twitter进行数据分析
Twitter是一个流行的社交网络,这里有大量的数据等着我们分析。Twitter R包是对twitter数据进行文本挖掘的好工具。 本文是关于如何使用Twitter R包获取twitter数据并将其导入R,然后对它进行一些有趣的数据分析。推 ...
中文文本分析方便工具包chinese.misc简介
中文文本分析方便工具包chinese.misc简介
chinese.misc(目前为0.1.3版本)的功能极其简单,主要用于对中文文本进行数据清理工作,此外还包含另外一些实用的处理和分析功能。在生成文档-词语矩阵的功能上,可以代替对中文不是太支持的tm包,特别是在减少乱码 ...
如何用 R 创作古诗
如何用 R 创作古诗
最近中国诗词大会很受欢迎,才女武亦姝凭借超强的记忆力和超快的反应能力一炮走红,成为大家心目中的偶像。在欣赏节目的同时,我也不禁想到,既然古代的诗人能够创作出这些美好的诗篇,那我是不是也能创作几首属于自 ...
Deep Learning in R · R语言深度学习
Deep Learning in R · R语言深度学习
深度学习是机器学习领域的一大热点,它可以对极度非线性的数据(包括图像等)进行建模。在过去的几年,深度学习在各应用领域展现了惊人的发展势头(Wikipedia 2016a)。其中包括图像和声音识别、无人驾驶、自然语言处理 ...
Rattle:数据挖掘的界面化操作
Rattle:数据挖掘的界面化操作
R语言是一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。这里的统计计算可以是数据分析、建模或是数据挖掘等,通过无数大牛提供的软件包,可以帮我们轻松实现算法的实施。一些读者觉 ...
R语言之正则表达式
R语言之正则表达式
正则表达式表通常被用来检索、替换那些符合某个模式(规则)的文本。在我看来,正则表达式的主要用途有两种:①查找特定的信息②查找并编辑特定的信息,也就是我们经常用的替换。。比如我们要在Word,记事本等里面使用 ...
最流行的机器学习R语言软件包是哪些?
最流行的机器学习R语言软件包是哪些?
caret 是一个用于创建机器学习工作流的一般包,并且它已经处于这个排名的首位置。接着的是实现特定机器学习算法的几个包:随机森林(Random Forests)(randomForest), 支撑向量机(Support Vector Machines)(e1071) ...
手把手教你用R语言建立信用评分模型(完结篇)— 打分卡转换
手把手教你用R语言建立信用评分模型(完结篇)— 打分卡转换
我们在上一部分,我们已经基本完成了建模相关的工作,并用混淆矩阵验证了模型的预测能力。接下来的步骤,就是将Logistic模型转换为标准打分卡的形式。 在建立标准评分卡之前,我们需要选取几个评分卡参数:基础分值 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2018-10-18 09:45 , Processed in 0.095617 second(s), 16 queries .