python实现两个文件夹的同步

其实无论windows还是Linux,简单地去实现两个两个文件夹的同步只需系统自带的复制命令加参数就可以了。

WINDOWS :

xcopy 源文件夹\* 目标文件夹 /s /e /y

Linux :

cp -r 源文件夹/* 目标文件夹

这里使用python来实现这些基本功能,并增加一些去重之类的增强功能。

1、复制源文件夹中文件至目标文件夹

要想同步两个文件夹中的数据,基本思路首先需要遍历源文件夹中的信息,将源文件夹中的文件复制到目标文件夹。

遍历文件夹采用os中的listdir函数就可以了。

import os

path_s = 'F:\\test\\s'
path_t = 'F:\\test\\t'

for filename in os.listdir(path_s):
  filename_s = path_s+os.sep+filename
  print '[*] Source :',filename_s
  filename_t = path_t+os.sep+filename
  print '[*] Target :',filename_t
  with open(filename_s,'rb') as f_s:
    with open(filename_t,'wb') as f_t:
      f_t.write(f_s.read())

但是很明显这里没有考虑源文件夹中还会存在文件夹甚至多重文件夹的情况。

2、源文件夹中存在多重文件夹

一个简单的思路就是:在遍历源文件夹内的文件时,先判定当前文件这是文件还是文件夹。如果当前文件是文件夹的话,开始遍历此文件夹内的文件,如果里面还有文件夹,遍历这个文件夹,依次类推。利用递归的方法,代码如下:

import os

path_s = 'F:\\test\\s'
path_t = 'F:\\test\\t'

def copy_file(paths,patht):
  for filename in os.listdir(paths):
    filename_s = paths+os.sep+filename
    filename_t = patht+os.sep+filename
    if os.path.isdir(filename_s):
      if not os.path.exists(filename_t):
        os.mkdir(filename_t) #在目标文件夹中创建对应的文件夹
      copy_file(filename_s,filename_t) # 递归
    else:
      print '[*] Source :',filename_s

      print '[*] Target :',filename_t
      with open(filename_s,'rb') as f_s:
        with open(filename_t,'wb') as f_t:
          f_t.write(f_s.read())

copy_file(path_s,path_t)

目前,简单的文件夹复制功能已经实现了。

3、目标文件夹中已有文件不再复制

一个简单的方法就是在目标文件夹中复制文件之前先利用函数“os.path.exists”判定这个文件是否存在。

import os

path_s = 'F:\\test\\s'
path_t = 'F:\\test\\t'

def copy_file(paths,patht):
  for filename in os.listdir(paths):
    filename_s = paths+os.sep+filename
    filename_t = patht+os.sep+filename
    if os.path.isdir(filename_s):
      if not os.path.exists(filename_t):
        os.mkdir(filename_t)
      copy_file(filename_s,filename_t)
    else:
      if os.path.exists(filename_t):
        print '[*] "%s" already exists! ' % filename_t
      else:
        print '[*] Source :',filename_s

        print '[*] Target :',filename_t
        with open(filename_s,'rb') as f_s:
          with open(filename_t,'wb') as f_t:
            f_t.write(f_s.read())

copy_file(path_s,path_t)

这个办法避免了一部分已有文件的重复复制操作,减少了部分不必要的读写操作,但是却无法消除内容相同但名称、路径不同的重复文件。

4、利用MD5判定重复文件

目前判定两个文件是否相同,除了按字节逐个对比这个笨方法外,简单常用的办法就是利用MD5和CRC校验,或是按一定规律挑取文件的指定位置的数据块就行对比。

这次利用文件的MD5值,将目标文件夹中已有文件的MD5值保存到列表或字典中,每在源文件夹中读取一个文件就判定该文件的MD5值是否已经存在于MD5列表,没有的话再进行复制操作,并将该文件的MD5值写入列表。

import os
import hashlib

path_s = 'F:\\test\\s'
path_t = 'F:\\test\\t'
list_file = {}

def create_file_list(path):
  for name in os.listdir(path):
    filename = path+os.sep+name
    if os.path.isdir(filename):
      create_file_list(filename)
    else:
      with open(filename,'rb') as f:
        md5 = hashlib.md5(f.read()).hexdigest()
        if md5 not in list_file:
          list_file[md5] = 1

def copy_file(paths,patht):
  for filename in os.listdir(paths):
    filename_s = paths+os.sep+filename
    filename_t = patht+os.sep+filename
    if os.path.isdir(filename_s):
      if not os.path.exists(filename_t):
        os.mkdir(filename_t)
      copy_file(filename_s,filename_t)
    else:
      if os.path.exists(filename_t):
        print '[*] "%s" already exists! ' % filename_t
      else:
        with open(filename_s,'rb') as f_s:
          data = f_s.read()
          file_md5 = hashlib.md5(data).hexdigest()
          if file_md5 not in list_file:
            list_file[file_md5] = 1
            print '[*] Source :',filename_s
            print '[*] Target :',filename_t
            with open(filename_t,'wb') as f_t:
              f_t.write(data)
          else:
            print '[*] "%s"\'s MD5 already exists! ' % filename_t

create_file_list(path_t)
copy_file(path_s,path_t)

如下图,运行后内容相同的几个文件,只有第一次读取到的时候才写入目标文件夹,其他路径下的文件并没有复制到目标文件夹。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我们。

(0)

相关推荐

  • Python FTP两个文件夹间的同步实例代码

    具体代码如下所示: # -*- coding: utf-8 -*- ''''''' ftp自动检测源文件夹的更新,将源文件夹更新的内容拷贝到目标文件夹中 使用树的层序遍历算法,支持深度目录拷贝 ''' import os from ftplib import FTP import os,sys,string,datetime,time import shutil import socket class MyUpdateMonitor(object): def __init__(self, hos

  • python实现两个文件夹的同步

    其实无论windows还是Linux,简单地去实现两个两个文件夹的同步只需系统自带的复制命令加参数就可以了. WINDOWS : xcopy 源文件夹\* 目标文件夹 /s /e /y Linux : cp -r 源文件夹/* 目标文件夹 这里使用python来实现这些基本功能,并增加一些去重之类的增强功能. 1.复制源文件夹中文件至目标文件夹 要想同步两个文件夹中的数据,基本思路首先需要遍历源文件夹中的信息,将源文件夹中的文件复制到目标文件夹. 遍历文件夹采用os中的listdir函数就可以了

  • python同步两个文件夹下的内容

    本文实例为大家分享了python同步两个文件夹下的内容,供大家参考,具体内容如下 import os import shutil import time import logging import filecmp #日志文件配置 log_filename ='synchro.log' #日志输出格式化 log_format = '%(filename)s [%(asctime)s] [%(levelname)s] %(message)s' logging.basicConfig(format=l

  • python rsync服务器之间文件夹同步脚本

    本文实例为大家分享了python rsync服务器之间文件夹同步的具体代码,供大家参考,具体内容如下 About  rsync 配置两台服务器之间3ssh-key后,可以实现自动化无需手动输入密码,脚本如下: import argparse import datetime from functools import partial import multiprocessing as mp import os import paramiko as pmk import time def check

  • Python实现比较两个文件夹中代码变化的方法

    本文实例讲述了Python实现比较两个文件夹中代码变化的方法.分享给大家供大家参考.具体如下: 这里将修改代码后的目录与原始目录做对比,罗列出新增的代码文件,以及修改过的代码文件 # -*- coding: utf-8 -*- import os; folderA = "F:\\Projects\\FreeImageV3_14_1\\".lower(); folderB = u"E:\\Software\\图像解码库\\FreeImage3141\\FreeImage\\&q

  • Python编程实现两个文件夹里文件的对比功能示例【包含内容的对比】

    本文实例讲述了Python编程实现两个文件夹里文件的对比功能.分享给大家供大家参考,具体如下: #-*-coding:utf-8-*- #=============================================================================== # 目录对比工具(包含子目录 ),并列出 # 1.A比B多了哪些文件 # 2.B比A多了哪些文件 # 3.二者相同的文件:文件大小相同 VS 文件大小不同 (Size相同文件不打印:与Size不同文件显

  • Python实现合并同一个文件夹下所有txt文件的方法示例

    本文实例讲述了Python实现合并同一个文件夹下所有txt文件的方法.分享给大家供大家参考,具体如下: 一.需求分析 合并一个文件夹下所有txt文件 二.合并效果 三.python实现代码 # -*- coding:utf-8*- import sys reload(sys) sys.setdefaultencoding('utf-8') import os import os.path import time time1=time.time() ########################

  • python实现两个文件合并功能

    本文将会分析一个文件合并的程序,并指出在合并文件过程中需要注意的问题. 下面是需要合并的文件示例: 分析思路: 要将两个文件合并,首先要将文件读到内存中,成为列表.再将列表分割,按照类别将数据分开存储,即姓名.电话.邮箱.通过遍历列表1,依次与列表2比较,如果二者有重合的人,那么直接利用 .join([ ])姓名电话邮箱合并到一行,保存到另外一个列表变量里面.二者不重合的人,说明只有列表1中才有,故将此人的邮箱信息用str('-–')代替. 经过这次遍历之后,列表1中所有的人和列表2中与列表1中

  • Python实现拷贝/删除文件夹的方法详解

    本文实例讲述了Python实现拷贝 删除文件夹的方法.分享给大家供大家参考,具体如下: 1. 拷贝文件夹 from shutil import copytree, ignore_patterns copytree(source, destination, ignore=ignore_patterns('*.pyc', 'tmp*')) 注:shutil.copytree实现 def copytree(src, dst, symlinks=False, ignore=None): names =

  • 使用python如何删除同一文件夹下相似的图片

    前言 最近整理图片发现,好多图片都非常相似,于是写如下代码去删除,有两种方法: 注:第一种方法只对于连续图片(例一个视频里截下的图片)准确率也较高,其效率高:第二种方法准确率高,但效率低 方法一:相邻两个文件比较相似度,相似就把第二个加到新列表里,然后进行新列表去重,统一删除. 例如:有文件1-10,首先1和2相比较,若相似,则把2加入到新列表里,再接着2和3相比较,若不相似,则继续进行3和4比较-一直比到最后,然后删除新列表里的图片 代码如下: #!/usr/bin/env python #

随机推荐