详细谈谈iOS字符串翻转

前言

字符串翻转作为算法题已经是一个不能再基础的问题了,无非就是逆序遍历、双指针遍历、递归,代码也能分分钟写出来:

void strrev(char *str) {
 size_t start = 0;
 size_t end = start + strlen(str) - 1;

 while (start < end) {
  char ch = str[start];
  str[start++] = str[end];
  str[end--] = ch;
 }
}

OK,上面的代码放到 LeetCode 上绝对是能 AC 的,但是实际情况中能 AC 吗?答案肯定是不能的!一个靠谱的字符串翻转算法题放到 LeetCode 上至少是 Medium 的难度。

首先我们知道字符串有编码规则,比如我们常用的 UTF-8,Windows 早期采用的 UTF-16(函数名有 W 后缀的 API 采用这种编码)等等...对于英文字母等 ASCII 字符的情况,UTF-8 和 ASCII 编码都是一个字节,所以上述的方法没有太大问题。然而对于有中文的情况,一个中文字符在 UTF-8 中会占 3 个字节,如果单纯的按字节翻转就会出现乱码。

那怎么解决呢?

最简单的方法就是使用 mbstowcs 函数将 char * 类型的字符串转换为 wchar_t 类型的宽字符串,wchar_t 这个类型在 Linux、UNIX 系统上占 4 个字节,在 Windows 上占 2 个字节。4 个字节意味着字符将用 UTF-32 来编码,不管是汉字还是 Emoji 都能存放下来。但对于 2 个字节,也就是 UTF-16,汉字是能表示,但是 Emoji 这类位于辅助平面码位的字符需要两个码元来表示,本文的方法就暂不适用了。

首先我们来看一下改进版的字符串翻转:

static void strrev2(char *str) {
 setlocale(LC_CTYPE, "UTF-8");
 size_t len = mbstowcs(NULL, str, 0);
 wchar_t *wcs = (wchar_t *) calloc(len + 1, sizeof(wchar_t));
 mbstowcs(wcs, str, len + 1);

 size_t start = 0;
 size_t end = start + len - 1;

 while (start < end) {
  wchar_t wc = wcs[start];
  wcs[start++] = wcs[end];
  wcs[end--] = wc;
 }

 wcstombs(str, wcs, wcstombs(NULL, wcs, 0));
 free(wcs);
}

使用 mbstowcs 这类转换函数首先需要设置字符串的系统编码,不然函数无法确定你传入的 char * 是个什么东西,本文中不管是源码还是系统环境的 std I/O 都采用 UTF-8 编码。

接下来我们调用一次 mbstowcs 不传入目标地址和字符长度,这可以让函数直接计算所需的 wchar_t 个数并返回回来以便我们申请内存。

然后就是基于 wchar_t 的一个常规字符串翻转了,最后别忘了转换回去,释放内存即可。

Bonus: Cocoa 开发中的字符串翻转

作为 iOS 开发者,当然还要考虑 OC 中的解决方法了。

方案 1:

通过 API 遍历子串,然后前向插入到新的 NSMutableString 中。

- (NSString *)my_stringByReversing {
 NSMutableString *reversed = [NSMutableString stringWithCapacity:self.length];
 NSRange range = NSMakeRange(0, self.length);
 [self enumerateSubstringsInRange:range
        options:NSStringEnumerationByComposedCharacterSequences
       usingBlock:^(NSString * _Nullable substring, NSRange substringRange,
          NSRange enclosingRange, BOOL * _Nonnull stop) {
        [reversed insertString:substring atIndex:0];
       }];
 return [reversed copy];
}

这种方法是效果最好的,它会将 Composed Emoji(如 👨‍👩‍👧‍👧)也提取出来,因为这类 Emoji 是由多个 Unicode 字符组合而成的,所以即便是 4 个字节的 wchar_t 也容纳不下。但这种方法的弊端就是开销太大,稍后我们做一个比较。

方案 2:

通过 API 获取到 C String,然后用文章开头所述的方法处理,再重新用处理后的 C String 构造 NSString。

- (NSString *)my_stringByReversing2 {
 NSUInteger length = [self lengthOfBytesUsingEncoding:NSUTF8StringEncoding];
 char *buf = calloc(length + 1, 1);
 [self getCString:buf maxLength:length + 1 encoding:NSUTF8StringEncoding];
 strrev2(buf);
 NSString *reversed = [NSString stringWithCString:buf encoding:NSUTF8StringEncoding];
 free(buf);
 return reversed;
}

这种方法的好处就是高效,经测试,它与遍历的方法相比有 100 多倍的性能提升,但是问题就是无法处理复杂的 Emoji。

两种方法,在使用中需要好好衡量一下。

方案 3:

Swift。Swift 的 String 的基本单位是 Character,它是 Unicode Scalar 的集合,表示了一个可渲染的字符,包括 Composed Emoji。并且,String 是实现了 BidirectionalCollection,拥有 reversed 方法,可以轻松实现字符串翻转。另外要提醒大家一下,正由于 Swift 的 String 是基于 Character 的,对于取某个字符这样的操作,能复用之前的 Index 就复用,我见过很多人喜欢写

str.index(str.startIndex, offsetBy: i)

这样是很费性能的,因为 Index 的移动操作需要从起点遍历计算,用这种方法遍历一遍字符串的复杂度近似是 O(n!)。

大家有兴趣可以试试 Swift 的性能~

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对我们的支持。

(0)

相关推荐

  • IOS 字符串常用处理详细介绍

    IOS 字符串常用处理详细介绍 NSString *tempA = @"123"; NSString *tempB = @"456"; 1,字符串拼接 NSString *newString = [NSString stringWithFormat:@"%@%@",tempA,tempB]; 2,字符转int int intString = [newString intValue]; 3,int转字符 NSString *stringInt =

  • iOS中使用MD5加密字符串

    1,新建NSString的分类,记得添加加密所需的头文件#import <CommonCrypto/CommonDigest.h> , NSString+MD5.h: #import <Foundation/Foundation.h> #import <CommonCrypto/CommonDigest.h> @interface NSString (MD5) + (NSString *)md5To32bit:(NSString *)str; @end 2,编写加密方法

  • IOS开发之路--C语言数组和字符串

    概览 数组在C语言中有着特殊的地位,它有很多特性,例如它的存储是连续的,数组的名称就是数组的地址等.而在C语言中是没有String类型的,那么如果要表示一个字符串,就必须使用字符串数组.今天主要就介绍如下三个方面: 一维数组 多维数组 字符串 一维数组 一维数组操作比较简单,但是需要注意,数组长度必须是固定的,长度不能使用变量进行初始化:如果声明的同时进行赋值则数组长度可以省略,编译器会自动计算数组长度:同时数组不能先声明再一次性赋值(当然可以对每个元素一一赋值). #include <stdi

  • iOS时间字符串格式化输出技巧详解

    一.前言 最近项目开发过程中用到了大量的关于时间的处理,将后台返回的时间字符串转换为指定的格式时间再显示在UI上. 例如: 将后台返回的时间字符串2017-04-16 13:08:06转换为:2017年04月16日.2017年04月.04月16日.2017-04-16.2017-04.04-16.13:08.星期几等等. 项目是多人开发,由于前期没有统一处理时间转换的问题,后期发现项目中好多关于时间转换的代码,大部分都是通过(- : 等字符)截取成字符串数组再取相应时间拼接成指定格式,输出在UI

  • 解决IOS开发空字符串的方法

    解决IOS开发空字符串的方法 实例代码: -(Boolean) isEmptyOrNull:(NSString *) str { if (!str) { // null object return true; }else if(str == Null){ return true; }else if([str isKindOfClass:[NSNull class]]){ return true; }else { NSString *trimedString = [str stringByTrim

  • IOS判断字符串是不是纯数字的方法总结

    前言 在大家开发项目的时候,遇到需求可能是让我们只输入一段纯数字,这时候我们就要对这个字符串进行筛选判断,不符合纯数字进行提示操作,以求达到最好的交互效果也能满足需求. 下面介绍几种判断字符串是否为纯数字的方法 第一种方式是使用NSScanner: 1. 整形判断 - (BOOL)isPureInt:(NSString *)string{ NSScanner* scan = [NSScanner scannerWithString:string]; int val; return [scan s

  • IOS 中CATextLayer绘制文本字符串

    IOS 中CATextLayer绘制文本字符串 CATextLayer使用Core Text进行绘制,渲染速度比使用Web Kit的UILable快很多.而且UILable主要是管理内容,而CATextLayer则是绘制内容. CATextLayer的绘制文本字符串的效果如下: 代码示例: // 绘制文本的图层 CATextLayer *layerText = [[CATextLayer alloc] init]; // 背景颜色 layerText.backgroundColor = [UIC

  • IOS开发之字典转字符串的实例详解

    IOS开发之字典转字符串的实例详解 在实际的开发需求时,有时候我们需要对某些对象进行打包,最后拼接到参数中 例如,我们把所有的参数字典打包为一个 字符串拼接到参数中 思路:利用系统系统JSON序列化类即可,NSData作为中间桥梁 //1.字典转换为字符串(JSON格式),利用 NSData作为桥梁; NSDictionary *dic = @{@"name":@"Lisi",@"sex":@"m",@"tel&qu

  • iOS如何将字符串中特定后的字变成红色

    一,效果图. 二,代码. ViewController.m - (void)viewDidLoad { [super viewDidLoad]; // Do any additional setup after loading the view, typically from a nib. UILabel *testLabel=[[UILabel alloc]initWithFrame:CGRectMake(10, 100, 100, 50)]; testLabel.text=@"1234567

  • iOS开发中判断字符串为空的方法

    前言: 判断字符串为空:看似简单的问题,有人会说不就使用[string isEqualToString:@""]或者更简单的string.text == nil就行了嘛.但是并没有考虑到其中存在的一些问题,例如当字符串中存在空格或者换行时或者当请求后台数据时得到的是进行JSON解析的时候, 如果解析出的NSDictionary中某个key对应的value为空, 则系统会把它处理为NSNull类的单例对象.这些情况下,上面的判断方法就不会起到作用. 具体实现: + (BOOL)isBla

随机推荐