利用python将xml文件解析成html文件的实现方法

2025-02-19 06:06:35

功能就是题目所述，我的python2.7,装在windows环境，我使用的开发工具是wingide 6.0

1、首先是我设计的简单的一个xml文件，也就是用来解析的源文件

下面是这个文件website.xml内容：

<website>
<page name="index" title="fuckyou">
	<h1>welcome to</h1>
	<p>this is a moment</p>
<ul>
<li><a href="shouting.html" rel="external nofollow" >Shouting</a></li>
</ul>
</page>
<page name="shouting" title="mother">
<h1>My name is likeyou</h1>
</page>
</website>

解释：page就是对应一个html文件，这里有两个page也就是要解析成两个html文件，然后分别是index.html和shouting.html，其中在index.html中通过<a>链接转到shouting.html文件中显示shouting.html文件的内容

2、python代码实现解析（xmltest.py）

#!D:\Python27\python.exe
#-*- coding:utf-8 -*-
from xml.sax import parse
from xml.sax.handler import ContentHandler
class PageCreate(ContentHandler):
 pagethrough = False
 def startElement(self, name, attrs):
  if name == 'page':
   self.pagethrough = True
   self.out = open(attrs['name'] + '.html', 'w')
   self.out.write('<html>\n<head>\n')
   self.out.write('<title>%s</title>\n' %(attrs['title']))
   self.out.write('</head>\n<body>\n')
  elif self.pagethrough:
   self.out.write('<')
   self.out.write(name)
   for str,val in attrs.items():
    self.out.write(' %s="%s"' %(str, val))
   self.out.write('>') 

 def endElement(self, name):
  if name == 'page':
   self.out.write('</body>\n</html>')
   self.pagethrough = False
   self.out.close()
  if self.pagethrough:
   self.out.write('<')
   self.out.write('/' + name)
   self.out.write('>')

 def characters(self, content):
  if self.pagethrough:
   self.out.write(content)

parse('D:\\pyproject\\file\\website.xml', PageCreate())

代码解释：

使用xml.sax解析方法调用parse方法来解析，自己创建了一个解析类，继承了ContentHandler，在里面分别重写了startelement和endelement方法还有charactors方法，startelement方法是当找到xml文件中的开头标签时调用，如<a>、<h1>，passthrough变量是为了判断当前是否在page标签里面，true表示在page标签里面，就是属于当前page页面的元素，因为xml.sax是关注标签的，他不会管你是否在当前哪个page里面，然后后面的代码都容易理解，就是添加html的开头标签<html><head><body>等，注意,attrs储存的是标签的属性，例如<page>里面name="shouting"，name="index"，那么就attrs就储存这name="shouting"这个东西，从而在attrs里面获取name属性里面的shouting和index作为html文件的文件名，同理<a>里面的href=……也是通过这个数据获取，分别存在str和val变量中，并且通过write写进文件。

然后endelement就是当解析到</h1>这类的结尾标签的时候调用，添加结尾的标签，如果是文件结尾，那么就是</page>，这时候就把</html>、</body>这些html的结尾标签添加进去，否则，就是page页面里面的元素结尾标签

characters就是将开头标签于结尾标签之间找到的字符串添加进去

最后我们把python代码运行起来之后就可以看到在同一目录下生成了两个html文件，分别是shouting.html和index.html，打开index.html就可以看到一个叫做“shouting”的链接，点过去就打开了shouting.html

以上这篇利用python将xml文件解析成html文件的实现方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持我们。

python解析xml文件操作实例

本文实例讲述了python解析xml文件操作的实现方法.分享给大家供大家参考.具体方法如下: xml文件内容如下: <?xml version="1.0" ?>  <book> <title> sample xml thing </title> <author> <name> <first> ma </first
使用python解析xml成对应的html示例分享

SAX将dd.xml解析成html.当然啦,如果得到了xml对应的xsl文件可以直接用libxml2将其转换成html. 复制代码代码如下: #!/usr/bin/env python # -*- coding: utf-8 -*-#---------------------------------------# 程序:XML解析器# 版本:01.0# 作者:mupeng# 日期:2013-12-18# 语言:Python 2.7# 功能:将xml解析成对应的html#
Python将xml和xsl转换为html的方法

本文实例讲述了Python将xml和xsl转换为html的方法.分享给大家供大家参考.具体分析如下: 这里需要用libxml2,所以还要先安装了libxml2模块才能使用.代码如下: # -*- coding: mbcs -*- #!/usr/bin/python import libxml2, libxslt class compoundXML: def __init__(self): self._result = None self._xsl = None self._xml = None
Python实现把xml或xsl转换为html格式

前些天用python处理xml的转换的一个小程序,用来把xml,xsl转换成html. 用的libxml2,所以还要先安装了libxml2模块才能使用. # -*- coding: mbcs -*- #!/usr/bin/python import libxml2, libxslt class compoundXML: def __init__(self): self._result = None self._xsl = None self._xml = None def do(self, xm
python将xml xsl文件生成html文件存储示例讲解

前提:安装libxml2 libxstl 官方网站:http://xmlsoft.org/XSLT/index.html 安装包下载:http://xmlsoft.org/sources/ 下面是windows平台的exe安装文件下载: http://xmlsoft.org/sources/win32/python/这是转载的测试代码: 复制代码代码如下: # -*- coding: mbcs -*-#!/usr/bin/python import libxml2, libxslt class
利用python将xml文件解析成html文件的实现方法

功能就是题目所述,我的python2.7,装在windows环境,我使用的开发工具是wingide 6.0 1.首先是我设计的简单的一个xml文件,也就是用来解析的源文件下面是这个文件website.xml内容: <website> <page name="index" title="fuckyou"> <h1>welcome to</h1> <p>this is a moment</p> &
解决python将xml格式文件转换成txt文件的问题(xml.etree方法)

概述先来介绍一下xml格式的文件,从数据分析的角度去看xml格式的数据集,具有以下的优点开放性(能在任何平台上读取和处理数据,允许通过一些网络协议交换xml数据).简单性(纯文本,能在不同的系统之间交换数据).结构和内容分离(不同于HTML,数据的显示和数据本身是分开的).可扩展性(派生出其他标记语言) 问题描述那么我们在进行数据分析的时候,如何运用xml里面的数据呢? 我们就需要将这类文件转化成其他类型的文件. (其实我认为说成提取xml的数据组成新的类型文件比较好一点) 就我个人的观点,
python 解析XML python模块xml.dom解析xml实例代码

一 .python模块 xml.dom 解析XML的APIminidom.parse(filename)加载读取XML文件 doc.documentElement获取XML文档对象 node.getAttribute(AttributeName)获取XML节点属性值 node.getElementsByTagName(TagName)获取XML节点对象集合 node.childNodes #返回子节点列表. node.childNodes[index].nodeValue获取XML节点值 nod
利用Python将图片批量转化成素描图的过程记录

目录前言程序 Method 1 Method 2 完整代码结果总结前言正常图片转化成素描图片无非对图片像素的处理,矩阵变化而已.目前很多拍照修图App都有这一功能,核心代码不超30行.如下利用 Python 实现读取一张图片并将其转化成素描图片.至于批处理也简单,循环读取文件夹里的图片处理即可.具体代码可以去我的 GitHub下载. 程序 Method 1 def plot_sketch(origin_picture, out_picture) : a = np.asarray(Im
python 自动化将markdown文件转成html文件的方法

一.背景我们项目开发人员写的文档都是markdown文件.对于其它组的同学要进行阅读不是很方便.每次编辑完markdown文件,我都是用软件将md文件转成html文件.刚开始转的时候,还没啥,转得次数多了,就觉得不能继续这样下去了.作为一名开发人员,还是让机器去做这些琐碎的事情吧.故写了两个脚本将md文件转成html文件,并将其放置在web服务器下,方便其他人员阅读. 主要有两个脚本和一个定时任务: •一个python脚本,主要将md文件转成html文件: •一个shell脚本,主要用于管理逻
如何利用Python将html转为pdf、word文件

目录前言转 pdf 安装 pdfkit 库安装 wkhtmltopdf 文件 url 生成 pdf 本地 html 文件生成 pdf 转 word 安装 pypandoc 库安装 pandoc 软件使用补充:用python把pdf文件转换为word文件总结前言在日常中有时需将 html 文件转换为 pdf.word 文件.网上免费的大多数不支持多个文件转换的情况,而且在转换几个后就开始收费了. 转 pdf 转 pdf 中使用 pdfkit 库,它可以让 web 网页直接转为 p
Java实现将txt文件转成xls文件的方法

最近项目用到txt文件和xls文件的转换,这里记录一下具体的思路. 下面利用java代码实现txt转xls,这里要使用到jxl.jar包,这个包是通过java来操作Excel表格的工具类库. 该jar包支持字体.数字.日期操作,能够修饰单元格属性,还能够支持图像和图表,基本上已经满足我们的日常操作,最主要的是这套API是纯Java实现的,在Windows和Linux操作系统下,它都可以正确的处理Excel文件. 具体实现代码如下: package test; import java.io.Buf
利用python和百度地图API实现数据地图标注的方法

如题,先上效果图: 主要分为两大步骤使用python语句,通过百度地图API,对已知的地名抓取经纬度使用百度地图API官网的html例程,修改数据部分,实现呈现效果一.使用python语句,通过百度地图API,获取经纬度读取文件信息 import pandas as pd data = pd.read_excel('test_baidu.xlsx') data 图中可以看出,原始数据并没有经纬度. 2. 构建抓取经纬度函数 import json from urllib.request i
Java实现把文件压缩成zip文件的示例代码

实现代码 ackage org.fh.util; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.util.zip.ZipEntry; import java.util.zip.ZipOutputStream; /** * 说明:java压缩成zip * 作者:FH Admin * from:fhadmin.cn */ public class Fi
javascript加载xml 并解析各节点的值(实现方法)

实例如下: var xmlDoc = null; function LoadXml(xmlPath) { try { if (window.ActiveXObject) { xmlDoc = new ActiveXObject("Microsoft.XMLDOM"); } } catch (e) { try { xmlDoc = document.implementation.createDocument("", "", null); } cat

利用python将xml文件解析成html文件的实现方法

相关推荐

随机推荐