深入理解Swift中的Substring和String

前言

为文本字符串添加特性或者语法糖在各种编程语言中都很普遍。就拿大家都很熟悉的 C 语言举例,C 字符串本质是一个字符数组(characters array),但是每次输入字符串的时候不用输入 ['h','e','l','l','o'] ,直接打 hello 就可以了,因为这个操作编译器帮你做了。

更高级的语言比如 Swift 处理字符串就不仅仅是当做字符数组了,String 是一个完整的类型,并且有各种特性。我们先来看一下 String 的一个特性:substring。

简单的看一下 String

首先粗略的了解一下字符串的实现。下面的代码来自标准库中 String.swift :

public struct String {
 public var _core: _StringCore
}

当然也有一些其他初始化设置,不过在声明里只有这一个存储属性!秘密一定都在 StringCore.swift 里:

public struct _StringCore {
 public var _baseAddress: UnsafeMutableRawPointer?
 var _countAndFlags: UInt
 public var _owner: AnyObject?
}

在这个类型里还有很多其他东西,不过我们还是只关注存储属性:

  • Base address — 一个指向内部存储的指针
  • Count — 字符串长度,UInt 类型,在一个 64 位的系统中,意味着有 62(64 - 2) 位的空间可以表示长度。这是一个非常大的数字。所以字符串的长度不太可能溢出。
  • Flags — 两个 bits 用来做标志。第一位表示是否被 _StringBuffer 持有;第二位表示编码格式是 ASCII 还是 UTF-16。

_StringCore 的真实情况比这里提到的要复杂的多,但是通过上面的内容可以让我们更容易理解字符串的一些信息:字符串的内部存储和存储的大小(underlying storage and size)。

Substring

Swift 中要怎么创建一个 substring?最简单的方式就是通过下标从 string 取一段:

let str = "Hello Swift!"
let slice = str[str.startIndex..
<str index="" str="" startindex="" nbsp="" offsetby:="" 5="" hello=""></str>

虽然很简单,但是代码看起来不太优雅。

String 的索引不是直观的整型,所以截取时的位置索引需要利用 startIndex 和 index(_:offsetBy:)获取。如果是从字符串开始位置截取,可以省略掉 startIndex :

let withPartialRange = str[..
<str index="" str="" startindex="" nbsp="" offsetby:="" 5="" still="" hello=""></str>

或者用 collection 中的这个方法:

let slice = str.prefix(5)
// still "Hello"

要记住字符串也是 collection ,所以你可以用集合下的方法,比如 prefix(),suffix(), dropFirst() 等。

Substring 的内部原理

substring 一个神奇的地方是他们重用了父 string 的内存。你可以把 substring 理解为父 string 的其中一段。

举个例子,如果从一个 8000 个字符的字符串中截取 100 个字符,并不需要重新初始化 100 个字符的内存空间。

这也意味着你可能不小心就把父 string 的生命周期延长了。如果有一大段字符串,然后你只是截取了一小段,只要截取的小段字符串没有释放,大段的字符串也不会被释放。

Substring 内部到底是怎么做到的呢?

public struct Substring {
 internal var _slice: RangeReplaceableBidirectionalSlice
<string></string>

内部的 _slice 属性保存着所有关于父字符串的信息:

// Still inside Substring
internal var _wholeString: String {
 return _slice._base
}
public var startIndex: Index { return _slice.startIndex }
public var endIndex: Index { return _slice.endIndex }

计算属性 _wholeString(返回整个父字符串),startIndex 和 endIndex 都是通过内部的 _slice 返回。

也可以看出 slice 是如何引用父字符串的。

Substring 转换为 String

最后代码里可能有很多 substring,但是函数的参数类型需要的是 string。Substring 转换到 string 的过程也很简单:

let string = String(substring)

因为 substrings 和它的父字符串共享同一个内存空间,猜测创建一个新字符串应该会初始化一片新的存储空间。那么 string 的初始化到底过程是怎样的呢。

extension String {
 public init(_ substring: Substring) {
 // 1
 let x = substring._wholeString
 // 2
 let start = substring.startIndex
 let end = substring.endIndex
 // 3
 let u16 = x._core[start.encodedOffset..
<end encodedoffset="" nbsp="" 4a="" if="" start="" sameposition="" in:="" x="" unicodescalars="" end="" self="" 4b="" else=""></end>
  • 创建一个对原有父字符串的引用
  • 获取 substring 在父字符串中的开始和结束位置
  • 获取 UTF-16 格式的 substring 内容。_core 是 _StringCore 的一个实例。
  • 判断匹配的 unicode 编码,生成一个新的字符串实例

把 substring 转换成 string 的步骤非常简单,但是你可能要考虑是不是一需要这样做。是不是进行 substring 操作的时候都要求类型是 string?如果对 substring 的操作都需要转成 string,那么轻量级的 substring 也就失去了意义。

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对我们的支持。

您可能感兴趣的文章:

  • 详解Swift中的Characters字符类型与String字符串类型
  • swift 字符串String的使用方法
(0)

相关推荐

  • 详解Swift中的Characters字符类型与String字符串类型

    一.引言 Swift中提供了String类型与Characters类型来处理字符串和字符数据,Swift中的String类型除了提供了许多方便开发者使用的方法外,还可以与Foundation框架的NSString类进行转换,使用起来十分方便. 二.String基础 在Swift中,使用双引号来定义字符串,开发者可以通过如下代码来创建一个字符串常量: let str = "Hello, playground" 可以通过下面两种方式来创建空字符串: let str1 = "&qu

  • swift 字符串String的使用方法

    swift 字符串String的使用方法 1.声明 var str = "Hello, playground" //var str: String = "Hello, playground" // 空字符串 let emptyString = "" let emptyString2 = String() // 使用String()初始化字符串 let str2 = String("Hello, swift") 2.判断字符串是

  • 深入理解Swift中的Substring和String

    前言 为文本字符串添加特性或者语法糖在各种编程语言中都很普遍.就拿大家都很熟悉的 C 语言举例,C 字符串本质是一个字符数组(characters array),但是每次输入字符串的时候不用输入 ['h','e','l','l','o'] ,直接打 hello 就可以了,因为这个操作编译器帮你做了. 更高级的语言比如 Swift 处理字符串就不仅仅是当做字符数组了,String 是一个完整的类型,并且有各种特性.我们先来看一下 String 的一个特性:substring. 简单的看一下 Str

  • 初步理解Swift中的泛型

    如果你已经动手写过Swift的程序,相信你已经了解了Swift语言的知识,比如如何写类(class)和结构体(struct).但Swift可没这么简单,呵呵呵.这篇教程主要讲述Swift的一个强力的特性:泛型.这个特性在很多程序设计语言里都非常受欢迎. 对于类型安全(type-safe)语言,一个常见的问题就是如何编写适用于多种类型输入的程序.想象一下,两个整型数相加和两个浮点数相加的程序看起来应该非常类似,甚至一模一样才对.唯一的区别就是变量的类型不同. 在强类型语言中,你需要去定义诸如add

  • 深入理解Swift中的变量与常量

    前言 最近在学习Swift这门新语言,对于熟练掌握OC编程的iOS开发者来说其实很容易上手,但Swift的确在语法和编程习惯上改变了很多,对于从未了解OC语言而从Swift开始学习iOS开发的新手来说可能上手有一定难度,下面我将这段时间的学习成果结合在网上搜索的知识做一个简单的汇总,希望可以帮助到正在学习Swift的小伙伴们. 变量和常量的定义 Swift开发文档中是这样定义变量和常量的:常量和变量把名字和一个特定类型的值关联起来.常量的值一旦设置好便不能再被更改,然而变量可以在将来被设置为不同

  • 深入理解Swift中单例模式的替换及Swift 3.0单例模式的实现

    前言 除了 MVC.MVVM 之外,单例模式可以说是 iOS 开发中另一常见的设计模式.无论是 UIKit 或是一些流行的三方库,我们都能看到单例的身影.而我们开发者本身也会潜意识地将这些类库中的代码当作最佳实践并将其带入日常工作中,哪怕很多人都知道单例存在一些明显的缺陷. 针对单例的缺陷,本文将介绍一些替换或改造单例模式的方法来提升代码质量. 单例的优点 除了上面提到的模仿最佳实践之外,单例的流行肯定也有内在的原因和理由.例如:单例对象保证了只有一个实例的存在,这样有利于我们协调系统整体的行为

  • 深入理解Swift中的访问控制关键字

    前言 在Swift3.0以前有三种访问控制关键字,分别是private.internal和public.而在swift3以后,又在原来的基础上增加了两种访问控制关键字:fileprivate和open.他们可以看作是private和public的进一步细分.下面是各个修饰符的区别以及访问权限排序. 各个修饰符的区别 private swift3.0 private访问级别所修饰的属性或者方法只能在当前类里访问. class A { private func test() { print("thi

  • Java中由substring方法引发的内存泄漏详解

    内存溢出(out of memory ) :通俗的说就是内存不够用了,比如在一个无限循环中不断创建一个大的对象,很快就会引发内存溢出. 内存泄漏(leak of memory) :是指为一个对象分配内存之后,在对象已经不在使用时未及时的释放,导致一直占据内存单元,使实际可用内存减少,就好像内存泄漏了一样. 由substring方法引发的内存泄漏 substring(int beginIndex, int endndex )是String类的一个方法,但是这个方法在JDK6和JDK7中的实现是完全

  • 深入理解JS中的substr和substring

    substr 方法 返回一个从指定位置开始的指定长度的子字符串. stringvar.substr(start [, length ]) 参数 stringvar 必选项.要提取子字符串的字符串文字或 String 对象. start 必选项.所需的子字符串的起始位置.字符串中的第一个字符的索引为 0. length 可选项.在返回的子字符串中应包括的字符个数. 说明 如果 length 为 0 或负数,将返回一个空字符串.如果没有指定该参数,则子字符串将延续到 stringvar 的最后. 示

  • 深入理解JavaScript中为什么string可以拥有方法

    引子 我们都知道,JavaScript数据类型分两大类,基本类型(或者称原始类型)和引用类型. 基本类型的值是保存在栈内存中的简单数据段,它们是按值访问的.JS中有五种基本类型:Undefined.Null.Boolean.Number和String. 引用类型的值是保存在堆内存中的对象,它的值是按引用访问的.引用类型主要有Object.Array.Function.RegExp.Date. 对象是拥有属性和方法的,所以我们看到下面这段代码一点也不奇怪. var favs=['鸡蛋','莲蓬']

  • 深入理解Swift语言中的闭包机制

    在 Swift 中的闭包类似于结构块,并可以在任何地方调用,它就像 C 和 Objective C 语言内置的函数. 函数内部定义的常数和变量引用可被捕获并存储在闭包.函数被视为封闭的特殊情况,它有 3 种形式. 在 Swift 语言闭合表达式,如下优化,重量轻语法风格,其中包括: 推导参数并从上下文菜单返回值的类型 从单封表达的隐性返回 简略参数名称 尾部闭包语法 语法 下面是一个通用的语法定义用于闭包,它接受参数并返回数据的类型: 复制代码 代码如下: {(parameters) -> re

随机推荐