Python简繁体转换的简单实现步骤

目录
  • 1、opencc-python
    • 1.1安装opencc-python
    • 1.2内建的opencc翻译配置
    • 1.3简繁体转换
  • 2、zhtools
    • 2.1安装
    • 2.2简繁体转换
  • 3、zhconv
    • 3.1zhconv安装
    • 3.2使用方法
  • 4、文档的简繁体转换
  • 总结

1、opencc-python

首先介绍opencc中的Python实现库,它具有安装简单,翻译准确,使用方便等优点。对于我们日常的需求完全能够胜任。

1.1安装opencc-python

首先在terminal中安装opencc-python。

pip install opencc-python

1.2内建的opencc翻译配置

这里有四种内建的opencc翻译配置:

•t2s - 繁体转简体(Traditional Chinese to Simplified Chinese)

•s2t - 简体转繁体(Simplified Chinese to Traditional Chinese)

•mix2t - 混合转繁体(Mixed to Traditional Chinese)

•mix2s - 混合转简体(Mixed to Simplified Chinese)

1.3简繁体转换

import opencc  Python插件/素材/.源码Q群:903971231####
cc = opencc.OpenCC('t2s')
print(cc.convert(u'Open Chinese Convert(OpenCC)開放中文轉換,是一個致力於中文簡繁轉換的項目,提供高質量詞庫和函數庫(libopencc)。'))

输出结果如下:

2、zhtools

2.1安装

利用Python实现汉字的简体和繁体相互转换的命令也有人开发过,并发布到github上,地址:https://github.com/skydark/nstools/tree/master/zhtools。下载该项目中的 zh_wiki.py 和 langconv.py 两个文件,放到python代码目录下就可以了。

2.2简繁体转换

from langconv import Converter

def convert(text, flag=0):  #text为要转换的文本,flag=0代表简化繁,flag=1代表繁化简
rule = 'zh-hans' if flag else 'zh-hant'
return Converter(rule).convert(text)
text1 = '悄悄是别离的笙箫; 夏虫也为我沉默, 沉默是今晚的康桥'print(convert(text1))
text2 = '悄悄是別離的笙簫; 夏蟲也為我沉默, 沉默是今晚的康橋'print(convert(text2, 1))

转换后的结果为:

该方法的优点是轻量,使用方便,简洁,但可能翻译会不太准确。

3、zhconv

3.1zhconv安装

zhconv库直接使用pip安装,安装命令为:

pip install zhconv

3.2使用方法

zhconv支持以下地区词的转换:

zh-cn 大陆简体

zh-sg 马新简体(马来西亚和新加坡使用的简体汉字)

zh-tw 台灣正體(台湾正体)

zh-hk 香港繁體(香港繁体)

zh-hans 简体

zh-hant 繁體(繁体)
方法1:直接导入zhconv1

import zhconv
text = '此去经年,应是良辰好景虚设。便纵有千种风情,更与何人说?'
text1 = zhconv.convert(text, 'zh-hant')
text2 = zhconv.convert(text, 'zh-tw')
text3 = zhconv.convert(text, 'zh-hk')
print('转换为繁体:', text1)
print('转换为台湾正体:', text2)
print('转换为香港繁体:', text3)

转换结果为:

方法2:导入zhconv的convert

from zhconv import convert

text = '此去经年,应是良辰好景虚设。便纵有千种风情,更与何人说?'
text1 = convert(text, 'zh-hant')
print('转换为繁体:', text1)

转换结果为:

4、文档的简繁体转换

利用扩展库python-docx,可以将Word文档中的中文进行转换,简体转换为繁体:

pip install python-docx

这里我们使用zhconv库的方法来将word文档《匆匆》转换为《匆匆》繁体版:

Python源码/素材/解答Q群:903971231###
from zhconv import convert
from docx import Document

word = Document('《匆匆》.docx')
for t in word.paragraphs:
    t.text = convert(t.text, 'zh-hant')for i in word.tables:
for p in i.rows:
for h in p.cells:
h.text = convert(h.text, 'zh-hant')
word.save('《匆匆》繁体版.docx')

转换前:

转换后:

这样我们就实现了将《匆匆》这个文档转换为了繁体版。

总结

到此这篇关于Python实现简繁体转换的文章就介绍到这了,更多相关Python简繁体转换内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • Python实现简繁体转换

    简体繁体转换 如今,世界上存在两种中文,一种是中文简体,一种是中文繁体.如果要完全掌握中文语言的自然语言处理,那么简繁都不可避免.所以,掌握了简体与繁体的转换,往往能够事半功倍. 而HanLP也提供了简繁转换的类:CharTable,用它来执行字符正规化.比如简体转换繁体,全角转换半角,大写转换小写,都可以使用该类来实现. 使用CharTable进行简繁体转换 下面,我们来直接使用CharTable进行一段诗词的繁体到简单的转换.具体代码如下所示: if __name__ == "__main_

  • Python实现繁体中文与简体中文相互转换的方法示例

    本文实例讲述了Python实现繁体中文与简体中文相互转换的方法.分享给大家供大家参考,具体如下: 工作中需要将繁体中文转换成简体中文 上网找了些资料,发现这个包最方便:https://github.com/skydark/nstools/tree/master/zhtools 安装方法 不需要什么安装方法,只需要把这两个文件下载下来,保存到与代码同一目录下即可 https://raw.githubusercontent.com/skydark/nstools/master/zhtools/lan

  • Python实现繁體转为简体的方法示例

    本文实例讲述了Python实现繁體转为简体的方法.分享给大家供大家参考,具体如下: 这里需要用到两个文件,可以点击此处本站下载源文件:zh_wiki.py  和 langconv.py 或者从github下载: https://github.com/csdz/nstools/tree/master/zhtools 转换函数: from langconv import * def tradition2simple(line): # 将繁体转换成简体 line = Converter('zh-han

  • Python简繁体转换的简单实现步骤

    目录 1.opencc-python 1.1安装opencc-python 1.2内建的opencc翻译配置 1.3简繁体转换 2.zhtools 2.1安装 2.2简繁体转换 3.zhconv 3.1zhconv安装 3.2使用方法 4.文档的简繁体转换 总结 1.opencc-python 首先介绍opencc中的Python实现库,它具有安装简单,翻译准确,使用方便等优点.对于我们日常的需求完全能够胜任. 1.1安装opencc-python 首先在terminal中安装opencc-py

  • PHP输出控制功能在简繁体转换中的应用

    概要:本文对PHP的输出控制功能进行了简单介绍并对其在简繁体转化中的应用给出了具体思路和实例 一 PHP 输出控制功能介绍PHP作为当今流行的脚本语言之一,具有编写简便,执行速度快,扩充性好等优点.PHP的输出信息控制函数可以让你控制你的脚本输出的内容,可以用于许多不同的情况,特别是在你的脚本已经输出信息后需要发送文件头的情况以及需要对输出信息进行编辑处理的地方.输出控制函数不对使用 header() 或 setcookie() 发送的文件头信息产生影响,只对那些类似于 echo().print

  • Python 字符串大小写转换的简单实例

    ①所有字母都转换为大写 # -*- coding:utf-8 -*- if __name__ == "__main__":     a = 'hello, world!'     print(a.upper())输出: HELLO, WORLD! ②所有字母都转换为小写 # -*- coding:utf-8 -*- if __name__ == "__main__":     a = 'HELLO, WORLD!'     print(a.lower())输出: h

  • ASP.NET中实现中文简/繁体自动转换的类

    在中文网站开发中,为了满足台湾/香港等有中文繁体阅读习惯的用户,很多网站需要实现中文简/繁体转换. 当然在实际的开发中,还要注意网站的图片上如果有中文的,也需要根据当前显示的是简体,还是繁体进行切换,否则无法达到效果!在本文中,我只帖上汉字转换的代码.如果有不清楚怎么调用的,请在我的Blog下留下Email.我直接把调用代码例子发给你! 注意:如在实际应用中,发现有本例子字库以外的汉字,可以自己添加,繁体简体对应字在_sGB和_tGB中的对应位置要一致!否则转换会出问题! 代码例子: /// <

  • java开源好用的简繁转换类库推荐

    目录 引言 1. 实例体验 maven依赖 gradle依赖 2. 进阶使用 2.1 预热 2.2 卸载 2.3 通用方法 3. 小结 引言 今天给大家介绍一个非常有意思类库,基于java实现的简繁体转换,适用于后端.android等开发领域 源码地址:* liuyueyi/quick-chinese-transfer: 简繁转换,支持香港繁体,台湾繁体与简体互转 1. 实例体验 以maven做项目管理,可以直接从中央仓库下载,再pom文件中添加以下依赖即可 <!-- https://mvnre

  • Python操作MySQL数据库的简单步骤分享

    前言 现在Python越来越被大众所使用,特别是进入AI人工智能时代,对编程要求更加高效根据快捷,所以Python也经常成为人工智和大数据编程的重要语音.既然是编程语言就多多少少会需求对数据进行操作,这一篇我们带大家使用python对mysql进行的操作. 别的不说,直接上代码 MySQL 建表 建表的时候,遇到一些坑,没有解决,如修改 MySQL 的默认引擎,default-storage-engine=InnoDB;执行报错 ...无奈 use mybatistable; drop tabl

  • python读取excel数据绘制简单曲线图的完整步骤记录

    python读写excel文件有很多种方法: 用xlrd和xlwt进行excel读写 用openpyxl进行excel读写 用pandas进行excel读写 本文使用xlrd读取excel文件(xls,sxls格式),使用xlwt向excel写入数据 一.xlrd和xlwt的安装 安装很简单,windos+r调出运行窗口,输入cmd,进入命令行窗口,输入以下命令. 安装xlrd: pip install xlrd 安装xlwt: pip install xlwt xlrd的API(applica

  • JavaScript快速切换繁体中文和简体中文的方法及网站支持简繁体切换的绝招

    一般商业网站都有一个语言的需求,就是为了照顾使用正体中文的国人,会特地提供一个切换到正体中文的选项(或曰"繁体中文").传统做法是在服务端完成的,即通过某些控件或者过滤器转换文本语言.这里笔者介绍一种简单可行的方法,不是在服务端而是利用前端的 JavaScript 就可以切换正体中文. 大概六年前我还专门写过这议题的博文,这篇也是奠基在那篇文章(旧文也是参考了一高手代码)之上,<对 JavaScript 繁简字切换的小改进>.时过境迁,有必要把代码进行更新一下--以前的太稚

随机推荐