c++截取汉字和英文混合字符串代码实例

在C++里截取字符串可以使用string.substr(),可是这个函数只能按英文来截取,

如果是汉字可能就要计算好字符个数,如果是汉字和英文混合,那就只能望洋兴叹了。

可是恰好我需要这样一个函数,于是就自己实现了一个,其中如何判断汉字和英文

参看了此处

代码简单也无优化,若有更好的方法欢迎提出,代码如下。

#include <iostream>
#include <string>
#include<cstdio>
#include<vector>
#include<typeinfo>
using namespace std;

int is_zh_ch(char p)
{

  /*汉字的两个字节的最高为都为1,这里采用判断最高位的方法
  将p字节进行移位运算,右移8位,这样,如果移位后是0,
  则说明原来的字节最高位为0,不是1那么也就不是汉字的一个字节
  */
  if(~(p >> 8) == 0)
  {
    return 1;//代表不是汉字
  }

  return -1;
}

string sub(string str,int start,int end=-1)
{

  if(typeid(str)==typeid(string) && str.length()>0)
  {
    int len=str.length();

    string tmp="";

    //先把str里的汉字和英文分开
    vector <string> dump;
    int i=0;
    while(i<len)
    {
      if (is_zh_ch(str.at(i))==1)
      {
        dump.push_back(str.substr(i,2));
        i=i+2;

      }
      else
      {
        dump.push_back(str.substr(i,1));
        i=i+1;
      }
    }

    end=end>0?end:dump.size(); //end默认为dump.size
    if(start<0||start>end)
      printf("start is wrong");
     //直接从dump里取即可
    for(i=start; i<=end; i++)
    {
      tmp+=dump[i-1];
    }

    return tmp;
  }
  else
  {
    printf("str is not string\n");
    return "";

  }
}

int main()
{
  string p="半山wuji";
  cout<<sub(p,1,1)<<endl;
  cout<<sub(p,2,2)<<endl;
  cout<<sub(p,3);
}

以上所述是小编给大家介绍的c++截取汉字英文混合字符串详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对我们网站的支持!

(0)

相关推荐

  • C++ 字符串的反转五种方法实例

    复制代码 代码如下: //通过不同的方法,实现对所输入字符串的反转,可以很好地复习巩固 C++ 基础知识/*分析过程: 假设要使传递的字符串为常量const字符串,这样操作更加灵活,可直接传递字符串字面值进行反转,常见的解决方法就是,定义一个新的与传递过来字符串长度 相等的字符数组,然后进行字符串拷贝,把str字符按从左到右放置到字符数组中,然后采用循环来对字符数组中字符反转*//*第一种,采用以上思路解法,传递为const类型C风格字符指针,返回为char*类型*///直接使用字符数组赋值ch

  • C++中汉字字符串的截取

    1. 复制代码 代码如下: const char *str = "test测试test";while(*str){//这里只需要判断第一个字节大于0x80就行了,前提是输入的是合法的GBK字符串//原因在于,如果第一个字节大于0x80,那么它必然和后面一个字节一起组成一个汉字//所以就没有必要再去判断后面一个字节了//再强调一下,前提条件是输入合法的GBK字符串if(*str > 0x80){// 汉字,计数器++str += 2;//是汉字自然就该直接+2了}else{str+

  • Lua教程(五):C/C++操作Lua数组和字符串示例

    本文将介绍如何在C/C++里面操作Lua的数组和字符串类型,同时还会介绍如何在C/C++函数里面存储Lua状态(registry和upvalue),而registry在使用C/C++自定义类型时非常有用,可以方便地为userdata指定metatable. C/C++操作Lua数组 Lua数组Overview 在Lua里面,数组只不过是key为整数的table而已.比如一个table为array = {12,"Hello", "World"},它是一个数组,可以用下

  • C++常用字符串分割方法实例汇总

    本文实例汇总了C++常用字符串分割方法,分享给大家供大家参考.具体分析如下: 我们在编程的时候经常会碰到字符串分割的问题,这里总结下,也方便我们以后查询使用. 一.用strtok函数进行字符串分割 原型: char *strtok(char *str, const char *delim); 功能:分解字符串为一组字符串. 参数说明:str为要分解的字符串,delim为分隔符字符串. 返回值:从str开头开始的一个个被分割的串.当没有被分割的串时则返回NULL. 其它:strtok函数线程不安全

  • 基于C++字符串替换函数的使用详解

    在C++中,字符串替换有很多方法,这里主要说一下STL里的WString中的替换,虽然WString自带了一个Replace函数,但是只能替换一次,太不好了,因此单独写了个替换函数[函数] 复制代码 代码如下: /**         * @brief   实现字符串替换         * @param   orignStr 源串         * @param   oldStr  查找的串         * @param   newStr  替换的新串         * @return

  • c++实现strcat字符串连接库函数的方法详解

    原型 extern char *strcat(char *dest,char *src); 用法 #include <string.h> 功能 把src所指字符串添加到dest结尾处(覆盖dest结尾处的'\0')并添加'\0'. 说明 src和dest所指内存区域不可以重叠且dest必须有足够的空间来容纳src的字符串. 返回指向dest的指针. 举例  char str4[] = "Hello world";  char str5[] = "Hello Wor

  • C字符串与C++字符串的深入理解

    在C中,并没有字符串这个数据类型,而是使用字符数组来保存字符串.C字符串实际上就是一个以null('\0')字符结尾的字符数组,null字符表示字符串的结束.需要注意的是:只有以null字符结尾的字符数组才是C字符串,否则只是一般的C字符数组. C字符串定义时可以利用"="号进行初始化,但是以后不能利用"="对C字符串进行赋值.对C字符串的操作需要通过"string"文件中定义的字符串处理函数.例如://字符串的初始化char a[11] = &

  • C++输入一个字符串,把其中的字符按照逆序输出的两种方法解析

    用字符数组方法:基本思路是,先判断字符的结束标志'\0',然后从该位置向前输出.实现代码: 复制代码 代码如下: #include<iostream>using namespace std;int main(){ char a[50]; cout<<"please input a string:"; cin>>a; int i=0,k=0; while(i<50){        if(a[i]=='\0'){         k=i;    

  • C++实现strcmp字符串比较的深入探讨

    strcmp的实现函数简介原型:extern int strcmp(const char *s1,const char * s2); 用法:加头文件 #include <string.h> 功能:比较字符串s1和s2.一般形式:strcmp(字符串1,字符串2)返回值: 当s1<s2时,返回值<0 当s1=s2时,返回值=0 当s1>s2时,返回值>0 即:两个字符串自左向右逐个字符相比(按ASCII值大小相比较),直到出现不同的字符或遇'\0'为止.如:"A

  • c++中数字与字符串之间的转换方法(推荐)

    1.字符串数字之间的转换 (1)string --> char * string str("OK"); char * p = str.c_str(); (2)char * -->string char *p = "OK"; string str(p); (3)char * -->CString char *p ="OK"; CString m_Str(p); //或者 CString m_Str; m_Str.Format(&q

随机推荐