基于R语言赋值符号的区别说明

2025-01-30 03:01:24

R语言赋值可以用=或<-，一般都建议使用<-，那你知道这两个之间的区间吗？那你有没有见过‘<-'和‘='这种赋值方法吗？今天就来和大家聊聊这基本的赋值符号都有哪些区别。

首先我们来看看符号的优先级，和java,c这些编程语言的优先级类似。下面这些都取自R帮助文档，输入?Syntax即可查看，它是根据优先级从高到低排列的。

:: :::    access variables in a namespace
$ @    component / slot extraction
[ [[    indexing
^    exponentiation (right to left)
- +    unary minus and plus
:    sequence operator
%any%    special operators (including %% and %/%)
* /    multiply, divide
+ -    (binary) add, subtract
< > <= >= == !=    ordering and comparison
!    negation
& &&    and
| ||    or
~    as in formulae
-> ->>    rightwards assignment
<- <<-    assignment (right to left)
=    assignment (right to left)
?    help (unary and binary)

我们可以看到<-的优先级比=高，这一点我们在使用时一定要注意到。

现在来举几个简单例子看看

> median(x =1:10)
[1] 5.5> x
错误: 找不到对象'x'
> median(x <-1:10)
[1] 5.5
> x
 [1]  1  2  3  4  5  6  7  8  9 10

现在来看另外一个例子

> rm(x)
> median((x=1:10))
[1] 5.5
> x
 [1]  1  2  3  4  5  6  7  8  9 10

那这又是为什么不报错了呢？那是因为括号的优先级更高，它相当于先给x赋值，再传入到median，与下面例子等价。

> rm(x)
> x=1:10 #此时等价于x<-1:10
> median(x)
[1] 5.5
> x
 [1]  1  2  3  4  5  6  7  8  9 10

为什么此时输入x并没有报错而前面却报错？因为在这种情况下，x被定义在用户的当前工作空间，所以在这个使用median之后x还是存在的。

总结一下：

这说明使用这两种方法赋值的变量是存在不同的空间或作用域。= 赋值对象存在赋值时所在的空间，而<- 赋值对象存在当前整个空间。

看起来有点晦涩，现在来仔细说说这两个的区别：

(1) 赋值时所在的空间，比如median(x =1:10)，x的值仅存在median函数内部空间，在median函数外面访问不到x，所以前面程序中报错：错误: 找不到对象'x'。

(2) 当前整个空间，比如median(x <-1:10)，它其实就是median(x=x <-1:10)，<-优先级高，先执行x <-1:10，再赋值给x，只不过这里省略了，因为一般传参数时，我们都不写参数名。x存在于当前空间，所以x可以访问到。

如果我们定义一个函数，函数中变量用<-赋值，那么在函数外面还能访问到吗？

> rm(x)
> test<-function(){
+ x<-1
+ }
>test()
> x

错误: 找不到对象'x'

当然是不能的，因为x定义在test函数内部，仅存在test函数的空间里面，所以在该函数外面根本访问不到x。如果想访问到x，除了returen,也不是没有其他办法的。

现在来看看另外一种赋值方法，估计很少人见过，了解之后有助于我们理解赋值过程。

> '<-'(x,5) #等价于x<-5
> x
[1] 5
> '='(x,6)#等价于x=6
> x
[1] 6

简单了解之后，来做几个测试

一般情况下，将=和<-两个赋值符号同时使用就会出现一些错误，比如下面这例子，如果了解'<-'之后，那么就很容易理解。

> x<-y<-10 #等价于'<-'(x,'<-'(y,10))
> x
[1] 10
> y
[1] 10
> x <- y = 12
Error in x <- y = 12 : 没有"<-<-"这个函数
# 由于优先级的问题，它等价于'='('<-'(x,y),12),并不是'<-'(x,'='(y,12))
> x=y<-12 #不报错，等价于 '='(x,'<-'(y,12))

这里主要是因为优先级的问题，<-的优先级高于=。

为了说明什么时候用这两种赋值方法，先随便看一个函数，比如scan函数，我们可以发现传递参数用的都是=，因此传参数基本都是用=而不是<-。

scan(file = "", what = double(), nmax = -1, n = -1, sep = "",
     quote = if(identical(sep, "\n")) "" else "'\"", dec = ".",
     skip = 0, nlines = 0, na.strings = "NA",
     flush = FALSE, fill = FALSE, strip.white = FALSE,
     quiet = FALSE, blank.lines.skip = TRUE, multi.line = TRUE,
     comment.char = "", allowEscapes = FALSE,
     fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)

在R文档中有下面介绍（?assignOps ）：文档中介绍说<-可以用在任何地方，而=只能用在优先级高的地方，比如说表达式中或子表达式。

The operator <- can be used anywhere, whereas the operator = is only allowed at the

top level (e.g., in the complete expression typed at the command prompt) or as one

of the subexpressions in a braced list of expressions.

我觉得<-多用于赋值，而=更多用于传值，它们之间优先级不同，赋值对象作用域不同。在使用的时候，只要注意到变量工作的空间（作用域）以及符号之间的优先级，一般是不会出错的。

补充：R语言赋值语句<-, <<-, =, ％>％有什么区别？

<-和->是一对，可以向左和向右赋值；

=是单向的，作用和<-基本相同，但对函数中的变量通常使用=；

<<-这个是全局赋值，跟变量的作用域有关，一般不会用到

％>％：来自dplyr包的管道函数，其作用是将前一步的结果直接传参给下一步的函数，并作为右件表达式函数的第一个参数（或剩下唯一一个选项的设置），从而省略了中间的赋值步骤，可以大量减少内存中的对象，节省内存。

anscombe_tidy <- anscombe %>%mutate(observation = seq_len(n()))

以上代码等价于

anscombe_tidy=mutate(anscombe,observation = seq_len(n()))

以上为个人经验，希望能给大家一个参考，也希望大家多多支持我们。如有错误或未考虑完全的地方，望不吝赐教。

R语言多线程运算操作(解决R循环慢的问题)

已经大半年没有更新博客了..最近都跑去写分析报告半年没有R 这次记录下关于R循环(百万级以上)死慢死慢的问题,这个问题去年就碰到过,当时也尝试过多线程,but failed......昨天试了下,终于跑通了,而且过程还挺顺利 step1 先查下自己电脑几核的,n核貌似应该选跑n个线程,线程不是越多越好,线程个数和任务运行时间是条开口向下的抛物线,最高点预计在电脑的核数上. detectCores( )检查当前电脑可用核数我的是4所以step2选的是4 library(parallel) cl.
R语言向量下标操作

向量下标即元素在向量中的位置,在实践中我们可以利用下标(元素的位置)来找出自己想要的数. 利用runif函数生成包含10个正整数的向量x. options(digits = 1) set.seed(1234) x <- runif(10,min = 1,max = 20) x [1] 3 13 13 13 17 13 1 5 14 11 正整数下标我们可以输入正整数作为下标来找出对应位置的元素. 在[]内输入下标. #向量x的第一位置的元素 x[1] [1] 3 #向量x的第2位置的元素 x[
R语言中c()函数与paste()函数的区别说明

c()函数:将括号中的元素连接起来,并不创建向量 paste()函数:连接括号中的元素例如 c(1, 2:4),结果为1 2 3 4 paste(1, 2:4),结果为"1 2" "1 3" "1 4" c(2, "and"),结果为"2" "and" paste(2, "and"),结果为"2 and" 补充:R语言中paste函数的参数sep
R语言中cut()函数的用法说明

R语言cut()函数使用 cut()切割将x的范围划分为时间间隔,并根据其所处的时间间隔对x中的值进行编码. 参数:breaks:两个或更多个唯一切割点或单个数字(大于或等于2)的数字向量,给出x被切割的间隔的个数. breaks采用fivenum():返回五个数据:最小值.下四分位数.中位数.上四分位数.最大值. labels为区间数,打标签 ordered_result 逻辑结果应该是一个有序的因素吗? 先用fivenum求出5个数,再用labels为每两个数之间,贴标签,采用(]的区间,
R语言-有负下标里才能有零介绍

1.只有负下标里才能有零先看一个例子 >a<-c(1,2,3,4) >a[-1:1] > a[-1:1] Error in a[-1:1] : 只有负下标里才能有零 (1)只有负下标里才能有零,在这里的意思为: a[-1:0] 可行 a[0:4]也可行 a[-1:1]不可行也就是说要么是负索引到0,或者0到正索引,但不能同时出现正负索引. (2)a[0]结果为numberic(0),结果没有意义,如 > a[0]+10.9 numeric(0) > a[1]+10.
在R语言中实现Logistic逻辑回归的操作

逻辑回归是拟合回归曲线的方法,当y是分类变量时,y = f(x).典型的使用这种模式被预测Ÿ给定一组预测的X.预测因子可以是连续的,分类的或两者的混合. R中的逻辑回归实现 R可以很容易地拟合逻辑回归模型.要调用的函数是glm(),拟合过程与线性回归中使用的过程没有太大差别.在这篇文章中,我将拟合一个二元逻辑回归模型并解释每一步. 数据集我们将研究泰坦尼克号数据集.这个数据集有不同版本可以在线免费获得,但我建议使用Kaggle提供的数据集. 目标是预测生存(如果乘客幸存,则为1,否则为0)基于
R语言通过parallel包实现多线程运行方式

总的来说,R的运算速度不算快,不过类似并行运算之类的改进可以提高运算的性能.下面非常简要地介绍如何利用R语言进行并行运算 library(parallel) cl.cores <- detectCores() cl <- makeCluster(cl.cores) detectCores( )检查当前电脑可用核数. makeCluster(cl.cores)使用刚才检测的核并行运算.R-Doc里这样描述makeCluster函数:Creates a set of copies of R run
R语言-summary()函数的用法解读

summary():获取描述性统计量,可以提供最小值.最大值.四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计等. 结果解读如下: 1. 调用:Call lm(formula = DstValue ~ Month + RecentVal1 + RecentVal4 + RecentVal6 + RecentVal8 + RecentVal12, data = trainData) 当创建模型时,以上代码表明lm是如何被调用的. 2. 残差统计量:Residuals Min 1Q M
基于R语言赋值符号的区别说明

R语言赋值可以用=或<-,一般都建议使用<-,那你知道这两个之间的区间吗?那你有没有见过'<-'和'='这种赋值方法吗?今天就来和大家聊聊这基本的赋值符号都有哪些区别. 首先我们来看看符号的优先级,和java,c这些编程语言的优先级类似.下面这些都取自R帮助文档,输入?Syntax即可查看,它是根据优先级从高到低排列的. :: ::: access variables in a namespace $ @ component / slot extraction [ [[ indexing
基于R语言for循环的替换方案

R语言中,for循环运行比较慢 for(i in 1:1000){ print(i^2) } 补充:R语言:for循环使用小结基本结构展示: vals =c(5,6,7) for(v in vals){ print(v) } #即把大括号里的内容对vals里的每一个值都循环run一遍实例展示: 1. paste() 命令是把几个字符连接起来如paste("A","B","C",sep=" ")得到的就是"A B
基于R语言数据检验详解

目录 1.W检验(Shapiro–Wilk(夏皮罗–威克尔)W统计量检验) 2.K检验(经验分布的Kolmogorov-Smirnov检验) 3.相关性检验: 4.T检验 5.正态总体方差检验 6.二项分布总体假设检验 7.Pearson拟合优度χ2检验 8.Fisher精确的独立检验: 9.McNemar检验: 10.秩相关检验 11.Wilcoxon秩检验 1. W检验(Shapiro–Wilk (夏皮罗–威克尔 ) W统计量检验) 目标:检验数据是否符合某正态分布,如:标准正态分布N(0,
基于R语言xlsx安装遇到的问题及解决方案

1.java环境的安装,如果java安装的是64位使用R软件一定要是64位,如果使用32位会报错,版本一定要对应. 2.安装顺序要是install.packages("rJava") install.packages("xlsxjars") install.packages("xlsx") 3.如果之前不是安装2中那样的顺序安装,虽然rJava或者xlsxjars包都下载了,但是就是安装不上xlsx,这时候可以选择到R安装目录下的library中
基于R语言中的各种更新方法分享

宏包的更新卸载package remove.packages("mypackage") 查看的version R.version 或者 getRversion() 查看package的version packageVersion("mypackage") 更新包 update.packages() 或者 update.packages(ask = FALSE) 删除包 remove.packages("mypackage") R软件的更新 in
R语言基于Keras的MLP神经网络及环境搭建

目录 Intro 环境搭建本机电脑配置安装TensorFlow以及Keras 安装R以及Rstudio 基于R语言的深度学习MLP 在Rstudio中安装Tensorflow和Keras MNIST数据集的预处理深度学习MLP模型总结和学习笔记 Intro R语言是我使用的第一种计算机语言,也是目前的主流数据分析语言之一,常常被人与python相比较.在EDA,制图和机器学习方面R语言拥有很多的的package可供选择.但深度学习方面由于缺少学习库以及合适的框架而被python赶超.但K
R语言将变量分组的3种方法实例(含cut函数说明）

目录前言方法一:直接对分组变量进行赋值方法二:使用within函数对变量进行分组方法三:采用cut函数总结前言在数据处理的过程中,我们有时候需要将连续的数值数据转换为类别数据,比如将收入分成高.中和低三组,将学生成绩分为优.良.中.及格和不及格五组. 本来将基于R语言,采用三种方法来实现:第一种是对变量直接进行重新赋值,第二种是使用within函数对语句进行组织,第三种是cut函数. 首先我们定义一个数据框,这个数据框包括学生姓名和数学成绩两个变量. #定义数据框 mathScor
R语言数据建模流程分析

目录 Intro 项目背景前期准备数据描述数据清洗预分析及预处理数值型数据类别型数据特征 Boruta算法建模模型对比 Intro 近期在整理数据分析流程,找到了之前写的一篇代码,分享给大家.这是我上学时候做的一个项目,当时由于经验不足产生了一些问题,这些问题会在之后一点一点给大家讨论,避免各位踩坑.本篇分享会带一些讲解,可能有些地方不够清楚,欢迎留言讨论. 本次除了分享之外也是对自己之前项目的一个复盘.还是使用R语言(毕竟是我钟爱的语言).Python的如果有需求之后会放别的
详解R语言中的表达式、数学公式、特殊符号

在R语言的绘图函数中,如果文本参数是合法的R语言表达式,那么这个表达式就被用Tex类似的规则进行文本格式化. y <- function(x) (exp(-(x^2)/2))/sqrt(2*pi) plot(y, -5, 5, main = expression(f(x) == frac(1,sqrt(2*pi))*e^(-frac(x^2,2))), lwd = 3, col = "blue") library(ggplot2) x <- seq(0, 2*pi, b
R语言最简单的向量赋值方法示例

1. 生成等差数列的向量x x <- 1:10 #将x向量赋值为1 2 3 4 5 6 7 8 9 10 结果为 > x [1] 1 2 3 4 5 6 7 8 9 10 2. 将x的值全部修改成0 x[] <- 0 #非常简洁的赋值方法,建议使用 x[1:length(x)] <- 0 #不建议使用的赋值方法结果为: > x[] <- 0 > x [1] 0 0 0 0 0 0 0 0 0 0 3.使用seq函数 x <- seq(