炼数成金 商业智能R语言
订阅

R语言

CRAN上R包的十年增长史
CRAN上R包的十年增长史
在上周,由IBPAD举办的题为“寻找大数据与社会的联系”研讨会在巴西利亚大学召开。Daniel Marcelino受邀出席,并介绍了R包—SciencesPo。在研讨会上,Daniel Marcelino介绍了R的生态系统,并阐述了CRAN上R包的历史增 ...
使用neuralnet包在R中拟合一个神经网络模型
使用neuralnet包在R中拟合一个神经网络模型
在我看来,神经网络总是众多机器学习模型当中最让人感到兴奋的其中一个模型。它不仅因为含有一个功能强大的反向传播算法,而且这模型的复杂度(回想一下深度学校当中很多的隐含层)和结构是来源于人脑结构。然而,神 ...
如何从Github上轻松安装R包
如何从Github上轻松安装R包
越来越多的R包正在由世界上不同的人所创建,其中一部分原因是devtools包使得开发R包1变得更加简单。devtools包不仅让开发R包变得简单,而且用于分发R包。当开发者发布一个R包的时候,CRAN2一般是最常用的。使用insta ...
实现R与Hadoop联合作业的三种方法
实现R与Hadoop联合作业的三种方法
为了满足用R语言处理pb量级数据的需求,我们需要把它和Hadoop联合起来使用。本文的目的就是阐述实现二者联合作业的不同技术。Hadoop支持一些 Streaming API来将R语言中的函数传入,并在MapReduce模式下运行这些函数 ...
手把手教你使用R语言的主成分分析对城管事件数据分析
手把手教你使用R语言的主成分分析对城管事件数据分析
概念性的东西就不说那么多了,这次使用主成分分析主要目的并不是降维,而是分析城管数据中的事件类别之间是否存在关系,当然,城管事件类型有好几百,这里就只选取从去年九月到目前发生量前十的事件类别;如下图,排 ...
R语言与Tableau集成之可视化应用
R语言与Tableau集成之可视化应用
Tableau是一款非常棒的数据可视化商业软件,通过拖拉拽的方式迅速的实现数据可视化。而且该软件可以连接任何一种数据库,在处理大型数据时一点都不逊色。下面展示几幅Tableau绘制的图形:面积图、条形图的综合使用。 ...
R高效数据处理包dplyr和data.table,你选哪个?
R高效数据处理包dplyr和data.table,你选哪个?
dplyr和data.table是R的两个高效数据处理包,这两个包有它们各自的优点。dplyr包的语法更加优雅,提供了更易于人类所能理解的自然语言。data.table包的语法简洁,并且只需一行代码就可以完成很多事情。进一步地,dat ...
莆田医院的可视化(R语言版)
莆田医院的可视化(R语言版)
数据来源于凤凰资讯,由于数据隐藏在JS代码中,所以我们使用readLines读取,字符处理的方式获得数据.接下来,用一个函数提取每个rawHospital中的医院名,并整理成一个字符向量.获取经纬度使用某大神的baidumaprepo在 ...
深入对比数据科学工具箱:Python和R之争
深入对比数据科学工具箱:Python和R之争
在真实的数据科学世界里,我们会有两个极端,一个是业务,一个是工程。偏向业务的数据科学被称为数据分析(Data Analysis),也就是A型数据科学。偏向工程的数据科学被称为数据构建(Data Building),也就是B型数据科 ...
如何在R中操作非结构化数据?
如何在R中操作非结构化数据?
现代化数据科学中的 DataFrame 概念源起R语言,而 Python Pandas 和 Spark DateFrame 都是参考R设计的。不过在实际的网络数据通讯中,类似DateFrame这样的格式却并不是主流,真正主流的方式其实是JSON(JavaScript O ...
运用R绘制城市热点图
运用R绘制城市热点图
Uber运用大数据,建立了Location-based demand models。每天实时更新的热点地图 (Heatmaps)可以 有效帮助车主缩短空载时间,同时帮乘客减少等待时长。下面这张图甚至可以预测,这样车主会知道提前去哪 里等待可以载 ...
提升R代码运算效率的11个实用方法
提升R代码运算效率的11个实用方法
众所周知,当我们利用 R 语言处理大型数据集时,for 循环语句的运算效率非常低。有许多种方法可以提升你的代码运算效率,但或许你更想了解运算效率能得到多大的提升。本文将介绍几种适用于大数据领域的方法,包括简 ...
R语言-用R眼看琅琊榜小说的正确姿势
R语言-用R眼看琅琊榜小说的正确姿势
原著琅琊榜也是非常精彩的。有些电视剧里没明说的解析,在小说里会明文说出来,这让智商不够的楼主终于看懂了电视剧里各个对话的含义。不过小说有些太长,作者非常喜欢铺设伏笔以及涉及多个人物,如果想只看一个人或 ...
在R中使用quadprog包求解二次规划
在R中使用quadprog包求解二次规划
概述本文将探究一个被称为二次规划的优化问题,这是一种特殊形式的非线性约束优化问题。二次规划在许多领域都有运用,比如投资组合优化、求解支持向量机(SVM)分类问题等。在R中求解二次规划有许多包,这次,我们将讨 ...
如何用R来定制个性化PPT
如何用R来定制个性化PPT
ReporteRs包可以创建word,ppt,html文档。它可以格式化R的输出:如可编辑的矢量图,复杂的表格报告功能,企业模板文档的重用(.docx和.pptx)。它是一个很好的自动化报告工具,并且不需要你安装微软的任何产品。本 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2018-10-18 08:12 , Processed in 0.093434 second(s), 16 queries .