ISO-8859-1 、Latin-1 西欧编码介绍及应用

这些编码,早些时候在一些应用软件中经常看到,估计很多朋友也看到了,这些编码了!

从这个图,我们可以看到这类编码应用很广泛,那么我们一起看看,iso-8859-1字符集,到底是什么样字符集,有那些字符!为什么,它应用可以这么广泛!

计算机上面流行第一个字符集,是ascii码,是0-127 一个128字符。每个字符在里面有个对应编号,分别是0-127。如果用二进制表示,刚好是7位。这个字符集,在前期表示英文字符已经足够。后来,随着计算机普及,越来越多国家(欧洲),开始应用计算机,他们发现7位,共128字符。已经不能描述他们常用的字符了。因此想到要兼容ascii字符集,就指定了扩展ASCII字符集。最多是0-255,256个字符。其中0-127 128字符及位置编码 完全兼容ascii码。只是扩展了128-255位置编入了新字符!

该字符集,完全兼容ascii字符集,并且是刚好可以用一个字节表示里面所有字符位置。又称为扩展Ascii码!这也是第一个iso-8859-1字符集。又叫:Latin-1 编码(西欧编码),后来陆续出了iso-8859-2…-15字符集。都是完全兼容ascii码的。

说下几个概念吧,什么是字符集,什么是字符编码?

1、字符集,表示由一些指定的字符的所组成集合!ascii字符集,里面有128个字符
2、字符编码,每个字符集中字符,都有一个固定的编号,也叫该字符在字符集中的的编码!如:ascii字符集中,a 字符编码是97。

相同字符,会出现在多个字符集中吗,相同字符在不同字符集中编码一样吗?

从上面例子,我们可以看到,ascii字符集、iso-8859-1字符集 有128个字符相同的。经常相同的字符,可以出现在各个字符集中。但是,每个字符集对字符编号方式可能不同,因此,相同字符,在不同字符集中,编码结果可能不一样。当然,也有一样的!象ascii中所有字符编码,在iso-8859-1字符集中,都一样的。

弄清楚关于、字符集,字符编码概念。我们还有几个必须掌握的。就是,计算机是怎么样储存,显示字符的呢?

一个文件有很多符号组成,各式各样的!实际,计算机在存储时候,只是写入该字符所对应的字符编码值。将它存于磁盘或者在网络中传输!如果要显示时候,通过对应字符集中,字符编码值。然后可以转换到计算机 通用的字符集的对应字符编码。计算机每个字符形状,图像长相,都在字体中。然后,通过转换得到通用字符集的字符编码,找到对应的字符,及字体形状,然后显示出来!

字符在计算机存储、传输都是该字符所在字符集中编码值

好了,中间我们对字符概念做了很多的阐述、说明!下面,我们继续本页主题iso-8859-1字符集了。 它为什么能够这么广泛应用呢?

我们知道,单字节最多可以表示256字符,实际上很多字符(目前unicode有几十万字符),都需要用多个字节来存储!计算机在存储传输都以字节为单位!因此单字节的: iso-8859-1 是存储的最小单元。所以,无论你是多少个字节组成的字符,以单字节一个一个存储、传输!都不会改变原来的值,都可以很好保存它的值!计算机乱码,出现在显示的时候,在不正确的字符集中,查找对应字符编码的字符!经常是,编码选择字符集,跟做显示选择字符集不一致造成的!

在复制文件、传输文件不会造成字符编码问题。而出现问题时候,是字符做显示,或者将显示字符存储的时候,会出现问题!好了,这里面说的是iso-8859-1 其实,更多的是说说,字符编码的一些常识!明白这些,对于iso-8859-1的一些特点理解,可能 更容易了!

可能以前有朋友就问,我mysql是存中文的,为什么我选择字符集是Latin-1 ,是不是就出现乱码了。其实不会,它只是将接到任何字节,按照单字节,逐个逐个存储的。然后,读取时候,也逐个逐个字节的读出。没有改变任何保存内容,也没有做任何编码转换!这是,最为安全的!好了,就到这里了,欢迎朋友们交流!

(0)

相关推荐

  • ISO-8859-1 、Latin-1 西欧编码介绍及应用

    这些编码,早些时候在一些应用软件中经常看到,估计很多朋友也看到了,这些编码了! 从这个图,我们可以看到这类编码应用很广泛,那么我们一起看看,iso-8859-1字符集,到底是什么样字符集,有那些字符!为什么,它应用可以这么广泛! 计算机上面流行第一个字符集,是ascii码,是0-127 一个128字符.每个字符在里面有个对应编号,分别是0-127.如果用二进制表示,刚好是7位.这个字符集,在前期表示英文字符已经足够.后来,随着计算机普及,越来越多国家(欧洲),开始应用计算机,他们发现7位,共12

  • UUencode 编码,UU编码介绍、UUencode编码转换原理与算法

    UUencode编码起先用在unix网络中,先是Unix系统下将二进制的资料借由uucp邮件系统传输的一个编码程式,也是一种二进制到文字的编码.不属于MIME编码中一员.它也是定义了用可打印字符表示二进制文字一种方法,并不是一种新的编码集合.主要解决,二进制字符在传输.存储中问题.它早期在电子邮件中使用较多,最近这些年来基本上被MIME 中Base64所取代了.E-mail中一般采用UU.MIME.BINHEX三种编码标准! 我想,了解下这种编码将二进制字符转换为可打印字符实现思路!对我们以后做

  • Base64 编码介绍、Base64编码转换原理与算法

    Base64编码,是我们程序开发中经常使用到的编码方法.它是一种基于用64个可打印字符来表示二进制数据的表示方法.它通常用作存储.传输一些二进制数据编码方法!也是MIME(多用途互联网邮件扩展,主要用作电子邮件标准)中一种可打印字符表示二进制数据的常见编码方法!它其实只是定义用可打印字符传输内容一种方法,并不会产生新的字符集!有时候,我们学习转换的思路后,我们其实也可以结合自己的实际需要,构造一些自己接口定义编码方式.好了,我们一起看看,它的转换思路吧! Base64实现转换原理 它是用64个可

  • XXencode 编码,XX编码介绍、XXencode编码转换原理与算法

    Xxencode编码,也是一个二进制字符转换为普通打印字符方法.跟UUencode编码原理方法很相似,唯独不同的是可打印字符不同.通个UUencode编码,我们知道它有个缺点就是,64个可打印字符中,有很多的特殊字符.而XXencode编码方法,对64个原字符有做规范.这里它有跟Base64类型了.都有指定可打印字符范围.及编号.Xxencode编码在上世纪后期,IBM大型机中得到很广泛的应用.现在逐渐被Base64编码转换方法所取代了. Xxencode编码原理 XXencode将输入文本以每

  • Quoted-printable 编码介绍、Quoted-printable编码解码转换方法

    Quoted-printable 可译为"可打印字符引用编码"."使用可打印字符的编码",我们收邮件,查看信件原始信息,经常会看到这种类型的编码! 最多时候,我们在邮件头里面能够看到这样的编码!Content-Transfer-Encoding:quoted-printable 它是多用途互联网邮件扩展(MIME) 一种实现方式.其中MIME是一个互联网标准,它扩展了电子邮件标准,致力于使其能够支持非ASCII字符.二进制格式附件等多种格式的邮件消息.目前http协

  • Visual Studio 2022智能辅助编码介绍

    工欲善其事,必先利其器 作为一名.Net开发人员,开发利器当然是首选微软自家的:宇宙第一IDE - Visual Studio了. 这不 VS 2022 正式版已经发布近两个月了,我也体验了近两个月,今天来说说 VS 2022 有趣又强大的智能辅助编码,减少重复代码刻不容缓. 系统自有代码提示 比如我们常用的输出内容到控制台: 或者是定义一个空字符串: 或者再升级一下,根据上下文变量联想: 自动生成类属性 当我们在新建一个常用的类时,比如:用户.订单等.VS2022的辅助编码会帮我们自动生成相关

  • 编码史记

    字符编码的故事 字符是什么 字符是什么?就是有意义的图形,比如a,中等.在不同的国家代表不同的意思. 但是在计算机世界中只有0和1,好了,如何用0和1将这些字符表示出来呢?这就是编码存在的意义. 编码一点也不高深,就是一个计算机的01和字符ab的简单映射. 于是故事开始了... 很久很久以前,计算机世界只有美国人.美国人的文字造诣很低的,他们的所有文字就只有24个字母,甚至加上大写和小写,阿拉伯数字,计算机中的控制符(回车啥的)都不超过256个(只有127个).于是,对于他们来说,很自然,那么计

  • Java字符编码解码的实现详解

     字符集基础: Character set(字符集)          字符的集合,也就是,带有特殊语义的符号.字母"A"是一个字符."%"也是一个字符.没有内在数字价值,与 ASC II ,Unicode,甚至是电脑也没有任何的直接联系.在电脑产生前的很长一段时间内,符号就已经存在了. Coded character set(编码字符集)          一个数值赋给一个字符的集合.把代码赋值给字符,这样它们就可以用特定的字符编码集表达数字的结果.其他的编码字符

  • 计算机中的字符串编码、乱码、BOM等问题详解

    因为电脑是windows 7系统,开发环境又在linux,经常在linux碰到乱码问题,很是痛苦,于是决定好好了解编码的来龙气脉,并分享个各位,免得出现乱码时不知所措. 是否存在文件编码 在讲解字符编码之前,我们需先明确文件本身没有编码一说,只有文字才有编码的概念,我们通常说某个文件是什么编码,通常是指文件里字符的编码. vim为什么会出现乱码 我在linux下一般使用vim进行文件编辑,发现经常会碰到乱码的情况,那么为什么会出现乱码呢? 首先我们了解下vim编码方面的基础知识,关于编码方面vi

  • 详解DevEco Studio项目构建讲解、编写页面、布局介绍、页面跳转

    首先要知道鸿蒙的APP是怎么构成的?   HarmonyOS的应用软件包以APP Pack(Application Package)形式发布,它是由一个或多个HAP(HarmonyOS Ability Package)以及描述每个HAP属性的pack.info组成.HAP是Ability的部署包,HarmonyOS应用代码围绕Ability组件展开. 一个HAP是由代码.资源.第三方库及应用配置文件组成的模块包,可分为entry和feature两种模块类型,如下图所示. 一.项目目录 首先来看一

随机推荐