炼数成金 商业智能R语言
订阅

R语言

手把手教你用R语言建立信用评分模型(三)— —Logistic模型建构
手把手教你用R语言建立信用评分模型(三)— —Logistic模型建构
我们在上一篇变量筛选专题中,使用WoE完成了单变量分析的部分。接下来,我们会用经过清洗后的数据看一下变量间的相关性。注意,这里的相关性分析只是初步的检查,进一步检查模型的多重共线性还需要通过 VIF(variance ...
手把手教你用R语言建立信用评分模型(二)—单变量分析
手把手教你用R语言建立信用评分模型(二)—单变量分析
在风险建模的过程中,变量选择可以具体细化为单变量变量筛选 (Univariate Variable Selection)和多变量变量筛选 (Multivariate Variable Selection)。多变量变量筛选一般会利用Stepwise算法在变量池中选取最优变 ...
手把手教你用R语言建立信用评分模型(一)
手把手教你用R语言建立信用评分模型(一)
一般而言, 咨询公司为商业银行搭建统计评分卡模型,采用的语言大多是SAS,这是因为SAS语言背后,有SAS公司 (SAS Institute)提供很完备的产品方案和售后服务。对于程序安全性和稳定性要求较高的银行, 自然会将SAS ...
R vs Python:R是现在最好的数据科学语言吗?
R vs Python:R是现在最好的数据科学语言吗?
当我认为 R 语言最终会变得过时时,这似乎引起了恐惧——仿佛 R 语言已经过时了。我想要消除你的恐惧:R 语言仍然很流行。R 语言是过去十年中发展最快的编程语言之一。事实上,如果你开始学习数据科学,我仍然推荐从 ...
R语言knitr之rmarkdown
R语言knitr之rmarkdown
数据报告是作为数据分析师必不可少的工作之一,而目前大部分数据分析师所处环境可能是excel画图制表,然后制作成word或者email的方式。对于周期性的报告,每次重复操作其实蛮痛苦的。那么今天给大家安利一个可以自动 ...
Awesome R资源大全中文版来了,超过300+工具,还在等什么?
Awesome R资源大全中文版来了,超过300+工具,还在等什么?
虽然很早就知道R被微软收购,也很早知道R在统计分析处理方面很强大,开始一直没有行动过。。。直到 直到12月初在微软技术大会,看到我软的工程师演示R的使用,我就震惊了,然后最近在网上到处了解和爬一些R的资料, ...
用R分析林丹出轨事件
用R分析林丹出轨事件
前段时间,刘恺威疑似出轨的事件还没有完,林丹倒是承认被抓拍的事情是真的,并且当众道歉了。最近名人们都喜欢出轨,咱们就用R来分析一下,林丹事件和刘恺威事件之间,粉丝们的评论,有什么共同性,又有什么差异性 ...
美国大选倒计时:R语言和蒙特卡洛算法预测希拉里赢面高达89%
美国大选倒计时:R语言和蒙特卡洛算法预测希拉里赢面高达89%
总统大选不到一周,自己来预测一下竞选结果还是很有挺有趣的。虽然关于选举,有的是博客和网站的预测,但确切告诉你他们究竟用了什么模型,或者告诉你怎么做这个预测的却寥寥无几。但是,我接下来就会这么做!在本文 ...
写论文,没数据?R语言抓取网页大数据!
写论文,没数据?R语言抓取网页大数据!
纵观国内外,大数据的市场发展迅猛,政府的扶持也达到了空前的力度,甚至将大数据纳入发展战略。如此形势为社会各界提供了很多机遇和挑战,而我们作为卫生(医学)统计领域的一份子,更要把握好机会。放眼全球,大数据 ...
Google发布R语言格式规范内部指导
Google发布R语言格式规范内部指导
Google本次发布的R编程规范指导一共有15条,分别覆盖 文件名规范,变量名规范,每行代码长度,缩进,花括号使用,赋值表达,if else,分号的不使用,函数定义,函数注释等等。我们来具体看一下。代码格式规范:每行 ...
用R分析王宝强微博事件
用R分析王宝强微博事件
针对微博上的热点事件,你是否想自己动手做个数据分析?为了简化分析过程,数据化分析制作了一个免费开源的R包【https://github.com/sjhfx/rwda】,名字叫rwda,即R Weibo Data Analysis的首字母缩写。本文通过一个 ...
Create PowerPoint using R Knitr
Create PowerPoint using R Knitr
神马?R也可以做PPT?是的,PPT不是只有office可以做,我们的统计工具R照样可以做。首先,让我们看看R制作PPT都有哪些优势吧。LaTex排版R代码、R运行结果、文字、图片、表格等全部在一篇代码中搞定 (最重要的优势, ...
提升R语言运算效率的11个实用方法
提升R语言运算效率的11个实用方法
众所周知,当我们利用R语言处理大型数据集时,for循环语句的运算效率非常低。有许多种方法可以提升你的代码运算效率,但或许你更想了解运算效率能得到多大的提升。本文将介绍几种适用于大数据领域的方法,包括简单的 ...
深入对比数据科学工具箱:Python和R 非结构化数据的结构化
深入对比数据科学工具箱:Python和R 非结构化数据的结构化
在现实场景中,由于数据来源的异构,数据源的格式往往是难以统一的,这就导致大量具有价值的数据通常是以非结构化的形式聚合在一起的。对于这些非结构化数据,最常见的数据结构就是JSON,而对应的数据库就是MongoDB ...
R语言词云终极解决方案—wordcloud2包
R语言词云终极解决方案—wordcloud2包
现在你也可以在R语言中绘制多样的词云了。wordcloud2是基于wordcloud2.js封装的一个R包,使用HTML5的canvas绘制。浏览器的可视化具有动态和交互效果,相对于曾经的R包worldcoud,wordcloud2还支持任意形状的词云绘制 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2018-10-18 09:54 , Processed in 0.244124 second(s), 16 queries .