炼数成金 商业智能R语言
订阅

R语言

R高效数据处理包dplyr和data.table,你选哪个?
R高效数据处理包dplyr和data.table,你选哪个?
dplyr和data.table是R的两个高效数据处理包,这两个包有它们各自的优点。dplyr包的语法更加优雅,提供了更易于人类所能理解的自然语言。data.table包的语法简洁,并且只需一行代码就可以完成很多事情。进一步地,dat ...
莆田医院的可视化(R语言版)
莆田医院的可视化(R语言版)
数据来源于凤凰资讯,由于数据隐藏在JS代码中,所以我们使用readLines读取,字符处理的方式获得数据.接下来,用一个函数提取每个rawHospital中的医院名,并整理成一个字符向量.获取经纬度使用某大神的baidumaprepo在 ...
深入对比数据科学工具箱:Python和R之争
深入对比数据科学工具箱:Python和R之争
在真实的数据科学世界里,我们会有两个极端,一个是业务,一个是工程。偏向业务的数据科学被称为数据分析(Data Analysis),也就是A型数据科学。偏向工程的数据科学被称为数据构建(Data Building),也就是B型数据科 ...
如何在R中操作非结构化数据?
如何在R中操作非结构化数据?
现代化数据科学中的 DataFrame 概念源起R语言,而 Python Pandas 和 Spark DateFrame 都是参考R设计的。不过在实际的网络数据通讯中,类似DateFrame这样的格式却并不是主流,真正主流的方式其实是JSON(JavaScript O ...
运用R绘制城市热点图
运用R绘制城市热点图
Uber运用大数据,建立了Location-based demand models。每天实时更新的热点地图 (Heatmaps)可以 有效帮助车主缩短空载时间,同时帮乘客减少等待时长。下面这张图甚至可以预测,这样车主会知道提前去哪 里等待可以载 ...
提升R代码运算效率的11个实用方法
提升R代码运算效率的11个实用方法
众所周知,当我们利用 R 语言处理大型数据集时,for 循环语句的运算效率非常低。有许多种方法可以提升你的代码运算效率,但或许你更想了解运算效率能得到多大的提升。本文将介绍几种适用于大数据领域的方法,包括简 ...
R语言-用R眼看琅琊榜小说的正确姿势
R语言-用R眼看琅琊榜小说的正确姿势
原著琅琊榜也是非常精彩的。有些电视剧里没明说的解析,在小说里会明文说出来,这让智商不够的楼主终于看懂了电视剧里各个对话的含义。不过小说有些太长,作者非常喜欢铺设伏笔以及涉及多个人物,如果想只看一个人或 ...
在R中使用quadprog包求解二次规划
在R中使用quadprog包求解二次规划
概述本文将探究一个被称为二次规划的优化问题,这是一种特殊形式的非线性约束优化问题。二次规划在许多领域都有运用,比如投资组合优化、求解支持向量机(SVM)分类问题等。在R中求解二次规划有许多包,这次,我们将讨 ...
如何用R来定制个性化PPT
如何用R来定制个性化PPT
ReporteRs包可以创建word,ppt,html文档。它可以格式化R的输出:如可编辑的矢量图,复杂的表格报告功能,企业模板文档的重用(.docx和.pptx)。它是一个很好的自动化报告工具,并且不需要你安装微软的任何产品。本 ...
手把手: 如何用R作Polar图等
手把手: 如何用R作Polar图等
用R作如下的各国Gini系数的Polar barChart:作上图的R代码为:library(ggplot2)GiniData- read.csv('IncomeInequality.csv',head=T)Gini- ggplot(GiniData, aes(x=paste(GiniIndex,Country),y=GiniIndex,fill=GiniInd ...
R: 学习Gradient Boosting算法,提高预测模型准确率
R: 学习Gradient Boosting算法,提高预测模型准确率
引言预测模型的准确率可以用2种方法来提高:要么进行特征设计,要么直接使用boosting算法。参加过许多数据科学大赛后,我发现许多人喜欢用boosting算法,因为它只需更少的时间就能产生相似的结果。目前有许多boosting ...
SAS与R优缺点讨论:从工业界到学界
SAS与R优缺点讨论:从工业界到学界
尽管在工业界还是被 SAS 所统治,但是 R 在学术界却得到广泛的应用,因为其免费、开源的属性使得用户们可以编写和分享他们自己的应用。然而,许多正在获得数据分析相关学位的学生们由于缺乏 SAS 经验的情况而在找工 ...
R语言预处理之异常值问题
R语言预处理之异常值问题
一、问题什么是异常值?如何检测异常值?二、解决方法1. 单变量异常值检测2. 使用局部异常因子进行异常值检测3. 通过聚类的方法检验异常值4. 检验时间序列数据里面的异常值三、R代码实现1、单变量异常值检测这一节主 ...
R 语言联盟将打造自家的代码托管平台 R-Hub
R 语言联盟将打造自家的代码托管平台 R-Hub
R 语言联盟( R Consortium )将打造一个新的代码托管平台 “R-Hub”,用于 R 语言的开发和分发软件包,这项计划得到 Linux 基金会的资助。R 语言是十分受欢迎的统计学编程语言。而 R 语言联盟是 Linux 基金会的协作 ...
做数据分析必须学R的4个理由
做数据分析必须学R的4个理由
R 是一种灵活的编程语言,专为促进探索性数据分析、经典统计学测试和高级图形学而设计。R 拥有丰富的、仍在不断扩大的数据包库,处于统计学、数据分析和数据挖掘发展的前沿。R 已证明自己是不断成长的大数据领域的一 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

热门文章

    社区热帖

       

      GMT+8, 2018-12-15 12:00 , Processed in 0.087616 second(s), 16 queries .