Python读取指定目录下指定后缀文件并保存为docx
最近有个奇葩要求 要项目中的N行代码 申请专利啥的
然后作为程序员当然不能复制粘贴 用代码解决。。
使用python-docx读写docx文件
环境使用python3.6.0
首先pip安装python-docx
pip install python-docx
然后下面是脚本 修改目录,这里默认取脚本运行目录下的src文件夹
取.cs后缀的所有文件 读取并保存为docx
有一点需要注意,如果文件中有中文,请用vscode或者其他编辑器使用utf-8格式打开,看看有没有乱码 其中每处理一个文件都会有print输出 当看到只有---start没有end的时候就可以找到该文件查看是否有上面说的情况,修改后保存重新执行,一直到全部执行完毕,保存好docx文件
代码
# -- coding: UTF-8 -- # Created by luody on 2017/4/7. import os from docx import Document saveFile = os.getcwd() + "/code.docx" mypath = os.getcwd() + "/src" doc = Document() doc.add_heading("代码文档", 0) p = doc.add_paragraph('服务端代码,使用语言') p.add_run('C#,SQL').bold = True lineNum = 0 for root, dirs, files in os.walk(mypath): for filespath in files: if (filespath.endswith('.cs')): doc.add_heading(filespath, level=1) codePage = '' print(filespath+' ---- start') for line in open(os.path.join(root, filespath), encoding="utf-8"): codePage += line lineNum += 1 print(filespath+' ---- end') doc.add_paragraph(codePage, style='IntenseQuote') doc.add_page_break() p = doc.add_paragraph(u'总行数:') p.add_run(str(lineNum)).bold = True doc.save('code.docx') print(lineNum)
以上所述是小编给大家介绍的Python读取指定目录下指定后缀文件并保存为docx,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对我们网站的支持!
相关推荐
-
Python获取文件所在目录和文件名的方法
实例如下: import os if __name__ == "__main__": file_path = 'D:/test/test.apk' parent_path = os.path.dirname(file_path) print('parent_path = %s' % parent_path) file_name = os.path.split(file_path)[-1] print('file_name = %s' % file_name) 输出: 以上就是小编为大家
-
Python列出一个文件夹及其子目录的所有文件
python简介 Python是一种解释型.面向对象.动态数据类型的高级程序设计语言. Python由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年. 像Perl语言一样, Python 源代码同样遵循 GPL(GNU General Public License)协议. >>> import os >>> for i in os.walk("."): ... print i[0],"\n##"
-
python之文件的读写和文件目录以及文件夹的操作实现代码
为了安全起见,最好还是给打开的文件对象指定一个名字,这样在完成操作之后可以迅速关闭文件,防止一些无用的文件对象占用内存.举个例子,对文本文件读取: file_object = open('thefile.txt') try: all_the_text = file_object.read( ) finally: file_object.close( ) Python读写文件实际操作的五大步骤 一.打开文件 Python读写文件在计算机语言中被广泛的应用,如果你想了解其应用的程序,以下的文章会给你
-
详解python中的文件与目录操作
详解python中的文件与目录操作 一 获得当前路径 1.代码1 >>>import os >>>print('Current directory is ',os.getcwd()) Current directory is D:\Python36 2.代码2 如果将上面的脚本写入到文件再运行 Current directory is E:\python\work 二 获得目录的内容 Python代码 >>> os.listdir (os.getcwd
-
Python实现拷贝多个文件到同一目录的方法
本文实例讲述了Python实现拷贝多个文件到同一目录的方法.分享给大家供大家参考,具体如下: 有一个文件,里面存有多个文件名,一个文件名一行.如果想把这些文件拷贝到一个目录,可以用下面的代码.下面的代码应该是跨系统的,除了分隔文件全路径那一句.下面的代码假设拷贝所有文件到当前目录的tmp子目录下,目录需先创建. #encoding=utf-8 import sys import shutil if len(sys.argv) < 2: print u'缺少参数文件名' exit(-1) par_
-
Python对文件和目录进行操作的方法(file对象/os/os.path/shutil 模块)
使用Python过程中,经常需要对文件和目录进行操作.所有file类/os/os.path/shutil模块时每个Python程序员必须学习的. 下面通过两段code来对其进行学习. 1. 学习 file对象 2. 学习os/os.path/shutil模块 1.file对象学习: 项目中需要从文件中读取配置参数,python可以从Json,xml等文件中读取数据,然后转换成Python的内容数据结构. 下面以Json文件为例,实现从Json文件中获取配置参数. code运行环境:python2
-
Python遍历目录中的所有文件的方法
os.walk生成器 os.walk(PATH), PATH是个文件夹路径,当然可以用.或者../这样啦. 返回的是个三元元组为元素的列表, 每个元素代表了一个文件夹下的内容.第一个就是当前文件夹下内容. 返回的三元元组代表(该工作文件夹, 该文件夹下的文件夹的列表, 该文件夹下文件的列表). 所以, 获得所有子文件夹, 就是(d代表这三元元组): os.path.join(d[0],d[1]); 获得所有子文件, 就是: os.path.join(d[0],d[2]); 以下例子使用了两套循环
-
Python遍历目录并批量更换文件名和目录名的方法
本文实例讲述了Python遍历目录并批量更换文件名和目录名的方法.分享给大家供大家参考,具体如下: #encoding=utf-8 #author: walker #date: 2014-03-07 #summary: 深度遍历指定目录,并将子目录和文件名改为小写 #注意,此程序只针对windows,windows下文件(夹)名不区分大小写 import os import os.path import shutil #读入指定目录并转换为绝对路径 rootdir = raw_input('ro
-
Python 读取某个目录下所有的文件实例
在处理数据的时候,因为没有及时的去重,所以需要重新对生成txt进行去重. 可是一个文件夹下有很多txt,总不可能一个一个去操作,这样效率太低了.这里我们需要用到 os 这个包 关键的代码 <span style="font-size:14px;"># coding=utf-8 #出现了中文乱码的问题,于是我无脑utf-8 .希望后期的学习可以能理解 import os import os.path import re import sys import codecs rel
-
Python读取指定目录下指定后缀文件并保存为docx
最近有个奇葩要求 要项目中的N行代码 申请专利啥的 然后作为程序员当然不能复制粘贴 用代码解决.. 使用python-docx读写docx文件 环境使用python3.6.0 首先pip安装python-docx pip install python-docx 然后下面是脚本 修改目录,这里默认取脚本运行目录下的src文件夹 取.cs后缀的所有文件 读取并保存为docx 有一点需要注意,如果文件中有中文,请用vscode或者其他编辑器使用utf-8格式打开,看看有没有乱码 其中每处理一个文件都会
-
python在指定目录下查找gif文件的方法
本文实例讲述了python在指定目录下查找gif文件的方法.分享给大家供大家参考.具体实现方法如下: #!/usr/bin/python # Use the standard find method to look for GIF files. import sys, find if len(sys.argv) > 1: dirs = sys.argv[1:] else: dirs = [ '.' ] # Go for it. for dir in dirs: files = find.find
-
Python读取一个目录下所有目录和文件的方法
本文实例讲述了Python读取一个目录下所有目录和文件的方法.分享给大家供大家参考,具体如下: 这里介绍的是刚学python时的一个读取目录的列子,给大家分享下: #!/usr/bin/python # -*- coding:utf8 -*- import os allFileNum = 0 def printPath(level, path): global allFileNum ''' 打印一个目录下的所有文件夹和文件 ''' # 所有文件夹,第一个字段是次目录的级别 dirList = [
-
php查找指定目录下指定大小文件的方法
本文实例讲述了php查找指定目录下指定大小文件的方法.分享给大家供大家参考.具体实现方法如下: php查找文件大小的原理是遍历目录然后再利用filesize来计算文件大小,然后我们再加一判断就可以了,下面整理了一些例子. 我们先来看遍历目录,代码如下: 复制代码 代码如下: function tree($directory) { $mydir = dir($directory); echo "<ul>n"; while($file = $mydir->r
-
java删除指定目录下所有空文件夹的方法
本文实例讲述了java删除指定目录下所有空文件夹的方法.分享给大家供大家参考,具体如下: package com.func; import java.io.File; import java.util.ArrayList; import java.util.List; /** * 删除指定目录下的所有空文件夹 * * @author zdw * */ public class FileUtils { List<File> list = new ArrayList<File>();
-
C++获取指定目录下的所有文件
本文实例为大家分享了C++获取指定目录下所有文件的具体代码,供大家参考,具体内容如下 1.获得指定目录下的所有文件(不搜索子文件夹) 需要包含的头文件 #include <io.h> #include <string> #include <vector> #include <fstream> 函数实现 void getAllFiles(string path, vector<string>& files) { // 文件句柄 long h
-
java删除指定目录下指定格式文件的方法
本文实例为大家分享了java删除指定目录下指定格式文件的具体代码,供大家参考,具体内容如下 正在看疯狂java讲义这本书,发现源码中有我不需要的class文件,想批量把它删除 代码如下: import java.io.File; public class Main { static int count = 0; public static void main(String[] args) { //路径 String path="/media/lcy/Data/Workspaces/java/cr
-
python读取一个目录下所有txt里面的内容方法
实例如下所示: import os allFileNum = 0 def printPath(level, path): global allFileNum ''''' 打印一个目录下的所有文件夹和文件 ''' # 所有文件夹,第一个字段是次目录的级别 dirList = [] # 所有文件 fileList = [] # 返回一个列表,其中包含在目录条目的名称 files = os.listdir(path) # 先添加目录级别 dirList.append(str(level)) for f
-
Python遍历某目录下的所有文件夹与文件路径
本文与<[Java]读取其下所有文件夹与文件的路径>(点击打开链接)为姊妹篇,主要讲述Python对于文件信息的读取操作. Python对于文件信息的读取操作,在其固有类os中. 下面以读取F盘下的所有文件夹作为例子说明这个问题: Python对于文件夹的遍历有两种写法,一种是直接利用其封装好的walk方法直接操作. 这是Python做得比Java优势的地方: # -*-coding:utf-8-*- import os for root,dirs,files in os.walk("
随机推荐
- Swift 常量与变量实例详解
- Python正则表达式教程之一:基础篇
- Spring中的事务管理实例详解
- Three.js学习之Lamber材质和Phong材质
- JS数组去重与取重的示例代码
- iOS 验证码按钮倒计时功能
- js实现淡入淡出轮播切换功能
- json中换行符的处理方法示例介绍
- 浅谈C#单例模式的实现和性能对比
- js转化毫秒为时间格式代码
- 图文介绍PHP添加Redis模块及连接
- Navicat for MySQL(mysql图形化管理工具)是什么?
- Nginx配置优化详解
- Java ThreadLocal 线程安全问题解决方案
- Android短信验证码(用的Mob短信验证)
- js上下视差滚动简单实现代码
- 微信公众平台之快递查询功能用法实例
- PHP读取PPT文件的方法
- 轻松解决Windows系统的棘手问题
- 交换机和路由器的几点区别