深入浅析C# 11 对 ref 和 struct 的改进

目录
  • 前言
  • 背景
  • ref 字段
  • 生命周期
    • scoped
    • unscoped
  • ref struct 约束
  • 反射
  • 实际用例
    • 栈上定长列表
    • 栈上链表
  • 未来计划
    • 高级生命周期
  • 总结

前言

C# 11 中即将到来一个可以让重视性能的开发者狂喜的重量级特性,这个特性主要是围绕着一个重要底层性能设施 refstruct 的一系列改进。

但是这部分的改进涉及的内容较多,不一定能在 .NET 7(C# 11)做完,因此部分内容推迟到 C# 12 也是有可能的。当然,还是很有希望能在 C# 11 的时间点就看到完全体的。

本文仅仅就这一个特性进行介绍,因为 C# 11 除了本特性之外,还有很多其他的改进,一篇文章根本说不完,其他那些我们就等到 .NET 7 快正式发布的时候再说吧。

背景

C# 自 7.0 版本引入了新的 ref struct 用来表示不可被装箱的栈上对象,但是当时局限性很大,甚至无法被用于泛型约束,也无法作为 struct 的字段。在 C# 11 中,由于特性 ref 字段的推动,需要允许类型持有其它值类型的引用,这方面的东西终于有了大幅度进展。

这些设施旨在允许开发者使用安全的代码编写高性能代码,而无需面对不安全的指针。接下来我就来对 C# 11 甚至 12 在此方面的即将到来的改进进行介绍。

ref 字段

C# 以前是不能在类型中持有对其它值类型的引用的,但是在 C# 11 中,这将变得可能。从 C# 11 开始,将允许 ref struct 定义 ref 字段。

readonly ref struct Span<T>
{
    private readonly ref T _field;
    private readonly int _length;
    public Span(ref T value)
    {
        _field = ref value;
        _length = 1;
    }
}

直观来看,这样的特性将允许我们写出上面的代码,这段代码中构造了一个 Span<T>,它持有了对其他 T 对象的引用。

当然,ref struct 也是可以被 default 来初始化的:

Span<int> span = default;

但这样 _field 就会是个空引用,不过我们可以通过 Unsafe.IsNullRef 方法来进行检查:

if (Unsafe.IsNullRef(ref _field))
{
    throw new NullReferenceException(...);
}

另外,ref字段的可修改性也是一个非常重要的事情,因此引入了:

  • readonly ref:一个对对象的只读引用,这个引用本身不能在构造方法或 init 方法之外被修改
  • ref readonly:一个对只读对象的引用,这个引用指向的对象不能在构造方法或 init 方法之外被修改
  • readonly ref readonly:一个对只读对象的只读引用,是上述两种的组合

例如:

ref struct Foo
{
    ref readonly int f1;
    readonly ref int f2;
    readonly ref readonly int f3;

    void Bar(int[] array)
    {
        f1 = ref array[0];  // 没问题
        f1 = array[0];      // 错误,因为 f1 引用的值不能被修改
        f2 = ref array[0];  // 错误,因为 f2 本身不能被修改
        f2 = array[0];      // 没问题
        f3 = ref array[0];  // 错误:因为 f3 本身不能被修改
        f3 = array[0];      // 错误:因为 f3 引用的值不能被修改
    }
}

生命周期

这一切看上去都很美好,但是真的没有任何问题吗?

假设我们有下面的代码来使用上面的东西:

Span<int> Foo()
{
    int v = 42;
    return new Span<int>(ref v);
}

v 是一个局部变量,在函数返回之后其生命周期就会结束,那么上面这段代码就会导致 Span<int> 持有的 v 的引用变成无效的。顺带一提,上面这段代码是完全合法的,因为 C# 之前不支持 ref 字段,因此上面的代码是不可能出现逃逸问题的。但是 C# 11 加入了 ref 字段,栈上的对象就有可能通过 ref 字段而发生引用逃逸,于是代码变得不安全。

如果我们有一个 CreateSpan 方法用来创建一个引用的 Span

Span<int> CreateSpan(ref int v)
{
     // ...
}

这就衍生出了一系列在以前的 C# 中没问题(因为 ref 的生命周期为当前方法),但是在 C# 11 中由于可能存在 ref 字段而导致用安全的方式写出的非安全代码:

Span<int> Foo(int v)
{
    // 1
    return CreateSpan(ref v);
    // 2
    int local = 42;
    return CreateSpan(ref local);
    // 3
    Span<int> span = stackalloc int[42];
    return CreateSpan(ref span[0]);
}

因此,在 C# 11 中则不得不引入破坏性更改,不允许上述代码通过编译。但这并没有完全解决问题。

为了解决逃逸问题, C# 11 制定了引用逃逸安全规则。对于一个在 e 中的字段 f

  • 如果 f 是个 ref 字段,并且 ethis,则 f 在它被包围的方法中是引用逃逸安全的
  • 否则如果 f 是个 ref 字段,则 f 的引用逃逸安全范围和 e 的逃逸安全范围相同
  • 否则如果 e 是一个引用类型,则 f 的引用逃逸安全范围是调用它的方法
  • 否则 f 的引用逃逸安全范围和 e 相同
  • 由于 C# 中的方法是可以返回引用的,因此根据上面的规则,一个 ref struct 中的方法将不能返回一个对非 ref 字段的引用:
ref struct Foo
{
    private ref int _f1;
    private int f2;

    public ref int P1 => ref _f1; // 没问题
    public ref int P2 => ref _f2; // 错误,因为违反了第四条规则
}

除了引用逃逸安全规则之外,同样还有对 ref 赋值的规则:

  • 对于 x.e1 = ref e2, 其中 x 是在调用方法中逃逸安全的,那么 e2 必须在调用方法中是引用逃逸安全的
  • 对于 e1 = ref e2,其中 e1 是个局部变量,那么 e2 的引用逃逸安全范围必须至少和 e1 的引用逃逸安全范围一样大

于是, 根据上述规则,下面的代码是没问题的:

readonly ref struct Span<T>
{
    readonly ref T _field;
    readonly int _length;

    public Span(ref T value)
    {
        // 没问题,因为 x 是 this,this 的逃逸安全范围和 value 的引用逃逸安全范围都是调用方法,满足规则 1
        _field = ref value;
        _length = 1;
    }
}

于是很自然的,就需要在字段和参数上对生命周期进行标注,帮助编译器确定对象的逃逸范围。

而我们在写代码的时候,并不需要记住以上这么多的规则,因为有了生命周期标注之后一切都变得显式和直观了。

scoped

在 C# 11 中,引入了 scoped 关键字用来限制逃逸安全范围:

局部变量 s 引用逃逸安全范围 逃逸安全范围
Span<int> s 当前方法 调用方法
scoped Span<int> s 当前方法 当前方法
ref Span<int> s 调用方法 调用方法
scoped ref Span<int> s 当前方法 调用方法
ref scoped Span<int> s 当前方法 当前方法
scoped ref scoped Span<int> s 当前方法 当前方法

其中,scoped ref scoped 是多余的,因为它可以被 ref scoped 隐含。而我们只需要知道 scoped 是用来把逃逸范围限制到当前方法的即可,是不是非常简单?

如此一来,我们就可以对参数进行逃逸范围(生命周期)的标注:

Span<int> CreateSpan(scoped ref int v)
{
    // ...
}

然后,之前的代码就变得没问题了,因为都是 scoped ref

Span<int> Foo(int v)
{
    // 1
    return CreateSpan(ref v);

    // 2
    int local = 42;
    return CreateSpan(ref local);
    // 3
    Span<int> span = stackalloc int[42];
    return CreateSpan(ref span[0]);
}

scoped 同样可以被用在局部变量上:

Span<int> Foo()
{
    // 错误,因为 span 不能逃逸当前方法
    scoped Span<int> span1 = default;
    return span1;

    // 没问题,因为初始化器的逃逸安全范围是调用方法,因为 span2 可以逃逸到调用方法
    Span<int> span2 = default;
    return span2;
    // span3 和 span4 是一样的,因为初始化器的逃逸安全范围是当前方法,加不加 scoped 都没区别
    Span<int> span3 = stackalloc int[42];
    scoped Span<int> span4 = stackalloc int[42];
}

另外,structthis 也加上了 scoped ref 的逃逸范围,即引用逃逸安全范围为当前方法,而逃逸安全范围为调用方法。

剩下的就是和 outin 参数的配合,在 C# 11 中,out 参数将会默认为 scoped ref,而 in 参数仍然保持默认为 ref

ref int Foo(out int r)
{
    r = 42;
    return ref r; // 错误,因为 r 的引用逃逸安全范围是当前方法
}

这非常有用,例如比如下面这个常见的情况:

Span<byte> Read(Span<byte> buffer, out int read)
{
    // ..
}

Span<int> Use()
    var buffer = new byte[256];
    // 如果不修改 out 的引用逃逸安全范围,则这会报错,因为编译器需要考虑 read 是可以被作为 ref 字段返回的情况
    // 如果修改 out 的引用逃逸安全范围,则就没有问题了,因为编译器不需要考虑 read 是可以被作为 ref 字段返回的情况
    int read;
    return Read(buffer, out read);

下面给出一些更多的例子:

Span<int> CreateWithoutCapture(scoped ref int value)
{
    // 错误,因为 value 的引用逃逸安全范围是当前方法
    return new Span<int>(ref value);
}

Span<int> CreateAndCapture(ref int value)
    // 没问题,因为 value 的逃逸安全范围被限制为 value 的引用逃逸安全范围,这个范围是调用方法
    return new Span<int>(ref value)
Span<int> ComplexScopedRefExample(scoped ref Span<int> span)
    // 没问题,因为 span 的逃逸安全范围是调用方法
    return span;
    // 没问题,因为 refLocal 的引用逃逸安全范围是当前方法、逃逸安全范围是调用方法
    // 在 ComplexScopedRefExample 的调用中它被传递给了一个 scoped ref 参数,
    // 意味着编译器在计算生命周期时不需要考虑引用逃逸安全范围,只需要考虑逃逸安全范围
    // 因此它返回的值的安全逃逸范围为调用方法
    Span<int> local = default;
    ref Span<int> refLocal = ref local;
    return ComplexScopedRefExample(ref refLocal);
    // 错误,因为 stackLocal 的引用逃逸安全范围、逃逸安全范围都是当前方法
    // 因此它返回的值的安全逃逸范围为当前方法
    Span<int> stackLocal = stackalloc int[42];
    return ComplexScopedRefExample(ref stackLocal);

unscoped

上述的设计中,仍然有个问题没有被解决:

struct S
{
    int _field;

    // 错误,因为 this 的引用逃逸安全范围是当前方法
    public ref int Prop => ref _field;
}

因此引入一个 unscoped,允许扩展逃逸范围到调用方法上,于是,上面的方法可以改写为:

struct S
{
    private int _field;
    // 没问题,引用逃逸安全范围被扩展到了调用方法
    public unscoped ref int Prop => ref _field;
}

这个 unscoped 也可以直接放到 struct 上:

unscoped struct S
{
    private int _field;
    public unscoped ref int Prop => ref _field;
}

同理,嵌套的 struct 也没有问题:

unscoped struct Child
{
    int _value;
    public ref int Value => ref _value;
}

unscoped struct Container
{
    Child _child;
    public ref int Value => ref _child.Value;
}

此外,如果需要恢复以前的 out 逃逸范围的话,也可以在 out 参数上指定 unscoped

ref int Foo(unscoped out int r)
{
    r = 42;
    return ref r;
}

不过有关 unscoped 的设计还属于初步阶段,不会在 C# 11 中就提供。

ref struct 约束

从 C# 11 开始,ref struct 可以作为泛型约束了,因此可以编写如下方法了:

void Foo<T>(T v) where T : ref struct
{
    // ...
}

因此,Span<T> 的功能也被扩展,可以声明 Span<Span<T>> 了,比如用在 byte 或者 char 上,就可以用来做高性能的字符串处理了。

反射

有了上面那么多东西,反射自然也是要支持的。因此,反射 API 也加入了 ref struct 相关的支持。

实际用例

有了以上基础设施之后,我们就可以使用安全代码来造一些高性能轮子了。

栈上定长列表

struct FrugalList<T>
{
    private T _item0;
    private T _item1;
    private T _item2;

    public readonly int Count = 3;
    public unscoped ref T this[int index] => index switch
    {
        0 => ref _item1,
        1 => ref _item2,
        2 => ref _item3,
        _ => throw new OutOfRangeException("Out of range.")
    };
}

栈上链表

ref struct StackLinkedListNode<T>
{
    private T _value;
    private ref StackLinkedListNode<T> _next;

    public T Value => _value;
    public bool HasNext => !Unsafe.IsNullRef(ref _next);
    public ref StackLinkedListNode<T> Next => HasNext ? ref _next : throw new InvalidOperationException("No next node.");
    public StackLinkedListNode(T value)
    {
        this = default;
        _value = value;
    }
    public StackLinkedListNode(T value, ref StackLinkedListNode<T> next)
        _next = ref next;
}

除了这两个例子之外,其他的比如解析器和序列化器等等,例如 Utf8JsonReaderUtf8JsonWriter 都可以用到这些东西。

未来计划

高级生命周期

上面的生命周期设计虽然能满足绝大多数使用,但是还是不够灵活,因此未来有可能在此基础上扩展,引入高级生命周期标注。例如:

void M(scoped<'a> ref MyStruct s, scoped<'b> Span<int> span) where 'b >= 'a
{
    s.Span = span;
}

上面的方法给参数 sspan 分别声明了两个生命周期 'a'b,并约束 'b 的生命周期不小于 'a,因此在这个方法里,span 可以安全地被赋值给 s.Span

这个虽然不会被包含在 C# 11 中,但是如果以后开发者对相关的需求增长,是有可能被后续加入到 C# 中的。

总结

以上就是 C# 11(或之后)对 refstruct 的改进了。有了这些基础设施,开发者们将能轻松使用安全的方式来编写没有任何堆内存开销的高性能代码。尽管这些改进只能直接让小部分非常关注性能的开发者收益,但是这些改进带来的将是后续基础库代码质量和性能的整体提升。

如果你担心这会让语言的复杂度上升,那也大可不必,因为这些东西大多数人并不会用到,只会影响到小部分的开发者。因此对于大多数人而言,只需要写着原样的代码,享受其他基础库作者利用上述设施编写好的东西即可。

到此这篇关于C# 11 对 ref 和 struct 的改进的文章就介绍到这了,更多相关C# 11  ref 和 struct改进内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • c#基础系列之ref和out的深入理解

    扩展阅读 c#基础系列1---深入理解 值类型和引用类型 c#基础系列2---深入理解 String 引言 在上篇文章深入理解值类型和引用类型的时候,有的小伙伴就推荐说一说ref和out 关键字,昨天晚上彻夜难眠在想是否要谈一下呢,因为可谈的不是太多,也可能是我理解的不够深刻. C#有两种参数传递方式:传值和引用,传值就是变量的值,而引用则是传递的变量的地址: 本文中说的Ref和Out都是引用传递,Ref的重点是把值传给调用方法,Out则是得到调用方法的值,类似于有返回类型的方法返回的值: 在使

  • C#中的只读结构体(readonly struct)详解

    翻译自 John Demetriou 2018年4月8日 的文章 <C# 7.2 – Let's Talk About Readonly Structs>[1] 在本文中,我们来聊一聊从 C# 7.2 开始出现的一个特性 readonly struct. 任一结构体都可以有公共属性.私有属性访问器等等.我们从以下结构体示例来开始讨论: public struct Person { public string Name { get; set; } public string Surname {

  • C#使用struct直接转换下位机数据的示例代码

    编写上位机与下位机通信的时候,涉及到协议的转换,比较多会使用到二进制.传统的方法,是将数据整体获取到byte数组中,然后逐字节对数据进行解析.这样操作工作量比较大,对于较长数据段更容易计算位置出错. 其实,对于下位机给出通讯的数据结构的情况下,可以直接使用C#的struct将数据直接转换.需要使用到Marshal. 数据结构 假定下位机(C语言编写)给到我们的数据结构是这个,传输方式为小端方式 typedef struct { unsigned long int time; // 4个字节 fl

  • c# Struct的一些问题分析

    目录 与类的区别: Struct的理论看过好一些,可是工作上基本没有应用过,Class倒处处都有.难道Struct就没有什么使用价值吗?搜了一下如何在类和结构中做出选择? ✔️ 如果类型的实例很小且通常寿命很短或通常嵌入其他对象中,请考虑定义结构而不是类. ❌ 避免定义结构,除非该类型具有以下所有特征: 它在逻辑上表示单个值,类似于原始类型(int,double等). 它的实例大小低于 16 字节. 它是不可变的. 它不必经常装箱. 在开发软件时,常常会有页面弹窗,而主页面经常需要传一些参数到窗

  • C#调用C类型dll入参为struct的问题详解

    前言 C# 可以通过 DllImport 的方式引用 C 类型的 dll.但很多 dll 的参数不会是简单的基础类型,而是结构体 struct .因此就需要在 C# 端定义同样的结构体类型,才能实现调用 C 类型 dll.这里例举几种不同的结构体情况,以及其对应的解决方案. 基础调用方式 对于一个结构体类型: typedef struct DATA { int nNumber; float fDecimal; }; 在 C# 端就需要定义为 [StructLayout(LayoutKind.Se

  • 深入浅析C# 11 对 ref 和 struct 的改进

    目录 前言 背景 ref 字段 生命周期 scoped unscoped ref struct 约束 反射 实际用例 栈上定长列表 栈上链表 未来计划 高级生命周期 总结 前言 C# 11 中即将到来一个可以让重视性能的开发者狂喜的重量级特性,这个特性主要是围绕着一个重要底层性能设施 ref 和 struct 的一系列改进. 但是这部分的改进涉及的内容较多,不一定能在 .NET 7(C# 11)做完,因此部分内容推迟到 C# 12 也是有可能的.当然,还是很有希望能在 C# 11 的时间点就看到

  • 详解c++11新特性之模板的改进

    C++11关于模板有一些细节的改进: 模板的右尖括号 模板的别名 函数模板的默认模板参数 模板的右尖括号 C++11之前是不允许两个右尖括号出现的,会被认为是右移操作符,所以需要中间加个空格进行分割,避免发生编译错误. int main() { std::vector<std::vector<int>> a; // error std::vector<std::vector<int> > b; // ok } 这个我之前都不知道,我开始学编程的时候就已经是C

  • 浅析C++11新特性的Lambda表达式

    lambda简介 熟悉Python的程序员应该对lambda不陌生.简单来说,lambda就是一个匿名的可调用代码块.在C++11新标准中,lambda具有如下格式: [capture list] (parameter list) -> return type { function body } 可以看到,他有四个组成部分: 1.capture list: 捕获列表 2.parameter list: 参数列表 3.return type: 返回类型 4.function body: 执行代码

  • 浅析C++11中的右值引用、转移语义和完美转发

    1. 左值与右值: C++对于左值和右值没有标准定义,但是有一个被广泛认同的说法:可以取地址的,有名字的,非临时的就是左值;不能取地址的,没有名字的,临时的就是右值. 可见立即数,函数返回的值等都是右值;而非匿名对象(包括变量),函数返回的引用,const对象等都是左值. 从本质上理解,创建和销毁由编译器幕后控制的,程序员只能确保在本行代码有效的,就是右值(包括立即数);而用户创建的,通过作用域规则可知其生存期的,就是左值(包括函数返回的局部变量的引用以及const对象),例如: int& fo

  • 解析C++11的std::ref、std::cref源码

    1.源码准备 本文是基于gcc-4.9.0的源代码进行分析,std::ref和std::cref是C++11才加入标准的,所以低版本的gcc源码是没有这两个的,建议选择4.9.0或更新的版本去学习,不同版本的gcc源码差异应该不小,但是原理和设计思想的一样的,下面给出源码下载地址 http://ftp.gnu.org/gnu/gcc 2.std::ref和std::cref的作用 C++本身就有引用(&),那为什么C++11又引入了std::ref(或者std::cref)呢? 主要是考虑函数式

  • C语言结构体(struct)常见使用方法(细节问题)

    基本定义:结构体,通俗讲就像是打包封装,把一些有共同特征(比如同属于某一类事物的属性,往往是某种业务相关属性的聚合)的变量封装在内部,通过一定方法访问修改内部变量. 结构体定义: 第一种:只有结构体定义 struct stuff{ char job[20]; int age; float height; }; 第二种:附加该结构体类型的"结构体变量"的初始化的结构体定义 //直接带变量名Huqinwei struct stuff{ char job[20]; int age; floa

  • C语言struct结构体介绍

    目录 struct struct的嵌套 实验 struct C 语言没有其他语言的对象(object)和类(class)的概念,struct 结构很大程度上提供了对象和类的功能. 下面是struct自定义数据类型的一个例子. struct tag { member-list member-list member-list ... } variable-list; 声明了数据类型car和该类型的变量car. struct car { char *name; float price; int spe

  • 在 C# 中使用 Span<T> 和 Memory<T> 编写高性能代码的详细步骤

    目录 .NET 中支持的内存类型 .NET Core 2.1 中新增的类型 访问连续内存: Span 和 Memory Span 介绍 C# 中的 Span Span 和 Arrays Span 和 ReadOnlySpan Memory 入门 ReadOnlyMemory Span 和 Memory 的优势 连续和非连续内存缓冲区 不连续的缓冲区: ReadOnly 序列 实际场景 Benchmarking 基准测试 安装 NuGet 包 Benchmarking Span 执行基准测试 解读

  • 解决asp.net core在输出中文时乱码的问题

    前言 作为一个.NET Web开发者,我最伤心的时候就是项目开发部署时面对Windows Server上贫瘠的解决方案,同样是神器Nginx,Win上的Nginx便始终不如Linux上的,你或许会说"干嘛不用windows自带的NLB呢",那这就是我这个小鸟的从众心理了,君不见Stack Overflow 2016最新架构中,用的负载和缓存技术也都是采用在Linux上已经成熟的解决方案吗.没办法的时候找个适合的解决办法是好事,有办法的时候当然要选择最好的解决办法. 所幸,.ASP.NE

随机推荐