r语言数据分析图(r语言数据分析图形化)
大家好!今天让创意岭的小编来大家介绍下关于r语言数据分析图的问题,以下是小编对此问题的归纳整理,让我们一起来看看吧。
开始之前先推荐一个非常厉害的Ai人工智能工具,一键生成原创文章、方案、文案、工作计划、工作报告、论文、代码、作文、做题和对话答疑等等
只需要输入关键词,就能返回你想要的内容,越精准,写出的就越详细,有微信小程序端、在线网页版、PC客户端
创意岭作为行业内优秀的企业,服务客户遍布全球各地,如需了解SEO相关业务请拨打电话175-8598-2043,或添加微信:1454722008
本文目录:
一、【数据分析与挖掘】R语言矩阵Matrix与数组Array
之前我们讲了向量,向量就仿佛一个一维数组一样
那么我们接下来就讲讲二维数组
创建一个matrix需要用到matrix函数
martix(参数1,nrow=行数,ncol=列数,byrow=布尔值)
参数1:matrix初始化的值,如果给出的值不够matrix长度将重复赋值,如果给出的值溢出将会报错。
参数byrow:这是一个布尔值如果给定TRUE,初始数据按行顺序推进,反之按列顺序推进。
这里说一下R语言中 ' . ' 并没有特殊的意义,只是变量名的一部分
读取矩阵我们用到:矩阵名[行,列]
这里的行和列可以接收单个数组也可以接收一个向量
当然如果是负数和向量一样就是排除掉对应索引指向的值
test.m[2, ] #取第二行,我们注意这里把列的地方空出来就是显示所有列
test.m[ ,2] #取第二列
test.m[2,2] #取第二行第二个
我们也可以给索引一个向量 比如3:4或者c(1,4)之类的,如上图所示,索引值也可以不连续
我们知道在二维表中 我们通常给每一行每一列取一个名字
矩阵中我们也可以这样做
首先我们给每一行每一列取一个名字,用向量保存
之后我们使用rownames(矩阵名)<-存有名字的向量给每行取名,给列取名同理见上图
取名之后我们可以用名称代替下标访问,例如:test.m['2nd','二']
看到这里,我真的觉得数据分析相关专业十分的艰难,需要用一些稀奇古怪的东西来进行数据分析
因为本人是计科专业的,平时用的数组就是单纯的数组,R语言的数组我一开始是令我怀疑人生的。
创建一个数组我们需要用到array函数
array(data=数组中的数据从1维平铺, dim=给定一个数值型向量, dimnames=list(包含一维名称的向量,二维名称....))
其中data参数用来给出数组的数据从第一维第一个开始顺序向后平铺
dim给定数组的纬度和每纬的宽度
dimnames给每个纬度的每格的名字 #这个参数可以忽略
至于如何读取数组中的数据和矩阵一致这里不再叙述,只不过把二维改成多维的情况。
我截完图发现arr[2,2,2]这个例子并不好,如果我们查看arr[3,2,1]将会显示6。
二、R语言 | 差异表达基因分析(DEGs)| 原始数据处理&火山图绘制
[1]Anders S, Huber W. Differential expression analysis for sequence count data. Genome Biol . 2010;11(10):R106. doi:10.1186/gb-2010-11-10-r106
三、R语言对应分析
@[toc]
Q型分析:样本之间的关系(聚类算法等)
R型分析:变量之间的关系(主成分分析、因子分析等)。
有时候我们不仅要弄清样本之间和变量之间的关系,还要弄清 样本与变量之间的关系 ,而对应分析就是这样一种分析方法。(变量就是指特征)
对应分析为我们可以提供三个方面的信息
上述三方面信息都可以通过二维图呈现出来
当对两个分类变量进行的对应分析称为 简单对应分析 ;
对两个以上的分类变量进行的对应分析称为 多重对应分析 。
对应分析将变量及变量之间的联系同时反映在一张二维或三维的散点图上,并使联系密切的类别点较集中,联系疏远的类别点较分散;通过观察对应分布图就能直观地把握变量类别之间的联系。
对于该方法,在减少维度方面与因子分析相似,在作分布图方面与多维尺度方法相似。
在对数据作对应分析之前,需要先了解因素间是否独立。如果因素之间相互独立,则没有必要进行对应分析,当因素间在统计学上具有显著的关联性时,在此基础上使用对应分析方法,其分析结果才具有意义。
p-value < 0.001,两组变量显著不独立,说明具有相关性。
四、用r语言做数据分析好学吗?
非常好学。输入几行代码,即可得到结果。
R不但数据分析好用,而且作图能力极好,推荐你用。
下面是R数据分析的一些代码,包括数据导入、方差分析、卡方测验、线性模型及其误差分析。希望可以帮到你:
1.1导入数据
install.packages('xslx')
library(xlsx)
Sys.setlocale("LC_ALL", "zh_cn.utf-8")
a=read.xlsx2('d:/1.xlsx',1,header=F)
head(a)显示前六行
class(a$y)/str(a)查看列/全集数据类型
a$y=as.numeric(a$y)转换数据类型
1.2方差分析(F test)
with(a,tapply(liqi,tan,shapiro.test))正态性检验
library(car)leveneTest(liqi~tan,a)方差齐性检验
q=aov(liqi~tan*chong,a)方差分析(正态型)
summary(q)
TukeyHSD(q)多重比较
1.3卡方测验(Pearson Chisq)
a1=summarySE(a,measurevar='y', groupvars=c('x1','x2'))卡方检验(逻辑型/计数型)
aa=a1$y
aaa=matrix(a2,ncol=2)
aaa= as.table(rbind(c(56,44), c(36,64), c(48,52),c(58,42)))
dimnames(aaa)= list(group=c("不添加抗性","不添加敏感","添加抗性","添加敏感"),effect=c("存活","死亡"))
aaa=xtabs(data=a,~x+y)
chisq.test(a)误差分析(卡方测验,Pearson法)
install.packages("rcompanion")
library(rcompanion)
pairwiseNominalIndependence(a)多重比较
1.4线性模型及其误差分析(Wald Chisq)
q=lm(data=a,y~x1*x2)一般线性模型(正态性)
summary(q)
q=glm(data=a,y~x1*x2,family = gaussian(link='identity'))广义线性模型(正态性)
summary(q)
q=glm(data=a,y~x1*x2,family = binomial(link='logit'))广义线性模型(逻辑型,二项分布)
summary(q)
q=glm(data=a,y~x1*x2,family = poisson(link='log'))广义线性模型(计数型,泊松分布)
summary(q)
install.packages('lmerTest')一般线性混合效应模型(正态性)
library(lmerTest)
install packages(‘lme4’)
library(lme4)
q=lmer(data=a,y~x1*(1|x2))
q=lmer(data=a,y~x1*(1|x2),family = gaussian(link='identity'))广义线性混合效应模型(正态性)
q=glmer(data=a,y~x1*(1|x2),family = binomial(link='logit'))广义线性混合效应模型(逻辑型,二项分布)
q=glmer(data=a,y~x1*(1|x2),family = poisson(link='log'))广义线性混合效应模型(计数型,泊松分布)
summary(q)
install.packages('car')
install.packages('openxlsx')
library(car)
install.packages('nlme')
library(nlme)
Anova(q,test='Chisq')线性模型的误差分析(似然比卡方测验,Wald法)
lsmeans(q,pairwise~chuli,adjust = "tukey")线性模型的多重比较(tukey法)
以上就是关于r语言数据分析图相关问题的回答。希望能帮到你,如有更多相关问题,您也可以联系我们的客服进行咨询,客服也会为您讲解更多精彩的知识和内容。
推荐阅读: