Python代码实现http/https代理服务器的脚本

一个几百行代码做出http/https代理服务器的脚本,启动即可做http https透明代理使用

python proxy.py 8992

使用非阻塞io模式,性能还可以。

可以和浏览器一样保持长连接,代码有点乱,不管那么多了能跑就行

几百行代码做出http/https代理服务器代码片段

*1. * [代码] [Python]代码

#!/usr/bin/python
#-*- coding:utf-8 -*-
import socket, logging
import select, errno
import os
import sys
import traceback
import gzip
from StringIO import StringIO
import Queue
import threading
import time
import thread
import cgi
from cgi import parse_qs
import json
import imp
from os.path import join, getsize
import re
import ssl
##################user config ##################
logger = logging.getLogger("network-server")
#############################################
def getTraceStackMsg():
 tb = sys.exc_info()[2]
 msg = ''
 for i in traceback.format_tb(tb):
  msg += i
 return msg
def InitLog():
 logger.setLevel(logging.DEBUG)
 fh = logging.FileHandler("network-server.log")
 fh.setLevel(logging.DEBUG)
 ch = logging.StreamHandler()
 ch.setLevel(logging.ERROR)
 formatter = logging.Formatter("%(asctime)s - %(name)s - %(levelname)s - %(message)s")
 ch.setFormatter(formatter)
 fh.setFormatter(formatter)
 logger.addHandler(fh)
 logger.addHandler(ch)
def clearfdpro(epoll_fd, params, fd):
 try:
  fd_check = int(fd)
 except Exception, e:
  print "fd error"
  sys.exit(1)
 try:
  #print "pid:%s, close fd:%s" % (os.getpid(), fd)
  epoll_fd.unregister(fd)
 except Exception, e:
  #print str(e)+getTraceStackMsg()
  pass
 try:
  param = params[fd]
  try:
   addr = param["addr"]
   if "next" in param:
    print "close sock, %s:%s" % (addr[0], addr[1])
  except Exception, e:
   pass
  param["connections"].shutdown(socket.SHUT_RDWR)
  param["connections"].close()
  f = param.get("f", None)
  if f != None:
   f.close()
  rc = param.get("rc", None)
  if rc != None:
   rc.close()
  if "read_cache_name" in param:
   os.remove(param["read_cache_name"])
 except Exception, e:
  #print str(e)+getTraceStackMsg()
  pass
 try:
  del params[fd]
  #logger.error(getTraceStackMsg())
  #logger.error("clear fd:%s" % fd)
 except Exception, e:
  #print str(e)+getTraceStackMsg()
  pass
def clearfd(epoll_fd, params, fd):
 try:
  param = params[fd]
  if "nextfd" in param:
   nextfd = param["nextfd"]
   next_param = params[nextfd]
   del param["nextfd"]
   del next_param["nextfd"]
   if not "next" in param: #masterfd
    clearfdpro(epoll_fd, params, nextfd)
   else: # nextfd
    if not "writedata" in next_param or len(next_param["writedata"]) == 0:
     clearfdpro(epoll_fd, params, nextfd)
    else:
     next_param["sendandclose"] = "true"
  clearfdpro(epoll_fd, params, fd)
 except Exception, e:
  #print str(e)+getTraceStackMsg()
  pass
def FindHostPort(datas):
 host_s = -1
 host_e = -1
 host_str = None
 host = ""
 port = ""
 if not datas.startswith("CONNECT"):
  host_s = datas.find("Host:")
  if host_s < 0:
   host_s = datas.find("host:")
  if host_s > 0:
   host_e = datas.find("\r\n", host_s)
  if host_s > 0 and host_e > 0:
   host_str = datas[host_s+5:host_e].strip()
   add_list = host_str.split(":")
   if len(add_list) == 2:
    host = add_list[0]
    port = add_list[1]
   else:
    host = add_list[0]
    port = 80
   first_seg = datas.find("\r\n")
   first_line = datas[0:first_seg]
   first_line = first_line.replace(" http://%s" % host_str, " ")
   datas = first_line + datas[first_seg:]
 else:
  first_seg = datas.find("\r\n")
  head_e = datas.find("\r\n\r\n")
  if first_seg > 0 and head_e > 0:
   first_line = datas[0:first_seg]
36a0
   com,host_str,http_version = re.split('\s+', first_line)
   add_list = host_str.split(":")
   if len(add_list) == 2:
    host = add_list[0]
    port = add_list[1]
   else:
    host = add_list[0]
    port = 443
   host_s = 1
   host_e = 1
 return host_str,host_s,host_e,host,port,datas
def connect_pro(params, param, epoll_fd, datas, fd, cur_time, host, port):
 try:
  nextfd = socket.socket(socket.AF_INET, socket.SOCK_STREAM, 0)
  nextfd.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
  nextfd.settimeout(5)
  try:
   nextfd.connect((host, int(port)))
  except Exception, e:
   print "########%s,%s connect fail" % (host,port)
  nextfd.setblocking(0)
  next_fileno = nextfd.fileno()
  print "pid:%s, connect %s:%s fd:%s" % (os.getpid(), host, port, next_fileno)
  if next_fileno in params:
   print "fileno exist"
   sys.exit(1)
  if not datas.startswith("CONNECT"):
   next_param = {"addr":[host,port],"writelen":0, "connections":nextfd, "time":cur_time, "nextfd":fd}
   param["nextfd"] = next_fileno
   next_param["writedata"] = datas
   next_param["writelen"] = 0
   next_param["next"] = "true"
   param["read_len"] = 0
   param["readdata"] = ""
   params[next_fileno] = next_param
   epoll_fd.register(next_fileno, select.EPOLLIN | select.EPOLLOUT | select.EPOLLERR | select.EPOLLHUP)
   epoll_fd.modify(fd, select.EPOLLIN | select.EPOLLERR | select.EPOLLHUP)
  else:
   next_param = {"addr":[host,port],"writelen":0, "connections":nextfd, "time":cur_time, "nextfd":fd}
   param["nextfd"] = next_fileno
   next_param["next"] = "true"
   params[next_fileno] = next_param
   epoll_fd.register(next_fileno, select.EPOLLIN | select.EPOLLERR | select.EPOLLHUP)
   param["read_len"] = 0
   param["readdata"] = ""
   param["writedata"] = "HTTP/1.1 200 Connection Established\r\nConnection: close\r\n\r\n"
   param["writelen"] = 0
   param["reuse"] = "true"
   epoll_fd.modify(fd, select.EPOLLIN | select.EPOLLOUT | select.EPOLLERR | select.EPOLLHUP)
 except socket.error, msg:
  clearfd(epoll_fd,params,fd)
def process_datas(process_status, params, param, epoll_fd, datas, read_len, fd, cur_time):
 if process_status == "close":
  clearfd(epoll_fd,params,fd)
 else:
  need_connect = False
  host_str = None
  host_s = -1
  host_e = -1
  if "reuse" in param and "next" not in param:
   if not datas.startswith("CONNECT") and \
     not datas.startswith("GET") and \
     not datas.startswith("POST") and \
     not datas.startswith("PUT"):
    del param["reuse"]
   else:
    host_str,host_s,host_e,host,port,datas = FindHostPort(datas)
    host_s = int(host_s)
    host_e = int(host_e)
    next_fileno = param["nextfd"]
    next_param = params[next_fileno]
    addr = next_param["addr"]
    if host_s > 0 and host_e > 0:
     if host != addr[0] or str(port) != str(addr[1]):
      print "%s,%s neq %s,%s" % (host,port,addr[0],addr[1])
      need_connect = True
      del param["nextfd"]
      del next_param["nextfd"]
      clearfd(epoll_fd,params,next_fileno)
     del param["reuse"]
    else:
     param["read_len"] = read_len
     param["readdata"] = datas
     return None
  if need_connect or not "nextfd" in param:
   if host_str == None or not host_s > 0 or not host_e > 0:
    host_str,host_s,host_e,host,port,datas = FindHostPort(datas)
    host_s = int(host_s)
    host_e = int(host_e)
   if host_s > 0 and host_e > 0:
    if not datas.startswith("CONNECT"):
     epoll_fd.modify(fd, select.EPOLLERR | select.EPOLLHUP) # 简单处理,http连接时把读去掉,避免内存攻击
    thread.start_new_thread(connect_pro,(params, param, epoll_fd, datas, fd, cur_time, host, port))
   else:
    param["read_len"] = read_len
    param["readdata"] = datas
  else:
   next_fileno = param["nextfd"]
   next_param = params[next_fileno]
   if "next" in param:
    next_param["reuse"] = "true"
   write_data = next_param.get("writedata", "")
   write_data += datas
   next_param["writedata"] = write_data
   param["read_len"] = 0
   param["readdata"] = ""
   epoll_fd.modify(next_fileno, select.EPOLLIN | select.EPOLLOUT | select.EPOLLERR | select.EPOLLHUP)
  if process_status == "close_after_process":
   print "close after process"
   clearfd(epoll_fd,params,fd)
def run_main(listen_fd):
 try:
  epoll_fd = select.epoll()
  epoll_fd.register(listen_fd.fileno(), select.EPOLLIN | select.EPOLLERR | select.EPOLLHUP)
  print "listen_fd:%s" % listen_fd.fileno()
 except select.error, msg:
  logger.error(msg)
 params = {}
 last_min_time = -1
 while True:
  epoll_list = epoll_fd.poll()
  cur_time = time.time()
  for fd, events in epoll_list:
   if fd == listen_fd.fileno():
    while True:
     try:
      conn, addr = listen_fd.accept()
      conn.setblocking(0)
      epoll_fd.register(conn.fileno(), select.EPOLLIN | select.EPOLLERR | select.EPOLLHUP)
      conn.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
      #conn.setsockopt(socket.IPPROTO_TCP, socket.TCP_NODELAY, True)
      params[conn.fileno()] = {"addr":addr,"writelen":0, "connections":conn, "time":cur_time}
     except socket.error, msg:
      break
   elif select.EPOLLIN & events:
    param = params.get(fd,None)
    if param == None:
     continue
    param["time"] = cur_time
    datas = param.get("readdata","")
    cur_sock = params[fd]["connections"]
    read_len = param.get("read_len", 0)
    process_status = "close"
    while True:
     try:
      data = cur_sock.recv(102400)
      if not data:
       if datas == "":
        break
       else:
        raise Exception("close after process")
      else:
       datas += data
       read_len += len(data)
     except socket.error, msg:
      if msg.errno == errno.EAGAIN:
       process_status = "process"
       break
      else:
       break
     except Exception, e:
      process_status = "close_after_process"
      break
    process_datas(process_status, params, param, epoll_fd, datas, read_len, fd, cur_time)
   elif select.EPOLLHUP & events or select.EPOLLERR & events:
    clearfd(epoll_fd,params,fd)
    logger.error("sock: %s error" % fd)
   elif select.EPOLLOUT & events:
    param = params.get(fd,None)
    if param == None:
     continue
    param["time"] = cur_time
    sendLen = param.get("writelen",0)
    writedata = param.get("writedata", "")
    total_write_len = len(writedata)
    cur_sock = param["connections"]
    f = param.get("f", None)
    totalsenlen = param.get("totalsenlen", None)
    if writedata == "":
     clearfd(epoll_fd,params,fd)
     continue
    while True:
     try:
      sendLen += cur_sock.send(writedata[sendLen:])
      if sendLen == total_write_len:
       if f != None and totalsenlen != None:
        readmorelen = 102400
        if readmorelen > totalsenlen:
         readmorelen = totalsenlen
        morefiledata = ""
        if readmorelen > 0:
         morefiledata = f.read(readmorelen)
        if morefiledata != "":
         writedata = morefiledata
         sendLen = 0
         total_write_len = len(writedata)
         totalsenlen -= total_write_len
         param["writedata"] = writedata
         param["totalsenlen"] = totalsenlen
         continue
        else:
         f.close()
         del param["f"]
         del param["totalsenlen"]
       if not "sendandclose" in param:
        param["writedata"] = ""
        param["writelen"] = 0
        epoll_fd.modify(fd, select.EPOLLIN | select.EPOLLERR | select.EPOLLHUP)
       else:
        clearfd(epoll_fd,params,fd)
       break
     except socket.error, msg:
      if msg.errno == errno.EAGAIN:
       param["writelen"] = sendLen
       break
      clearfd(epoll_fd,params,fd)
      break
   else:
    continue
  #check time out
  if cur_time - last_min_time > 20:
   last_min_time = cur_time
   objs = params.items()
   for (key_fd,value) in objs:
    fd_time = value.get("time", 0)
    del_time = cur_time - fd_time
    if del_time > 20:
     clearfd(epoll_fd,params,key_fd)
    elif fd_time < last_min_time:
     last_min_time = fd_time
if __name__ == "__main__":
 reload(sys)
 sys.setdefaultencoding('utf8')
 InitLog()
 port = int(sys.argv[1])
 try:
  listen_fd = socket.socket(socket.AF_INET, socket.SOCK_STREAM, 0)
 except socket.error, msg:
  logger.error("create socket failed")
 try:
  listen_fd.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
 except socket.error, msg:
  logger.error("setsocketopt SO_REUSEADDR failed")
 try:
  listen_fd.bind(('', port))
 except socket.error, msg:
  logger.error("bind failed")
 try:
  listen_fd.listen(10240)
  listen_fd.setblocking(0)
 except socket.error, msg:
  logger.error(msg)
 child_num = 19
 c = 0
 while c < child_num:
  c = c + 1
  newpid = os.fork()
  if newpid == 0:
   run_main(listen_fd)
 run_main(listen_fd)

总结

以上所述是小编给大家介绍的Python代码实现http/https代理服务器,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对我们网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

(0)

相关推荐

  • Python写的Socks5协议代理服务器

    直接上代码: #!/usr/bin/python # Filename s5.py # Python Dynamic Socks5 Proxy # Usage: python s5.py 1080 # Background Run: nohup python s5.py 1080 & import socket, sys, select, SocketServer, struct, time class ThreadingTCPServer(SocketServer.ThreadingMixIn

  • Python基于scrapy采集数据时使用代理服务器的方法

    本文实例讲述了Python基于scrapy采集数据时使用代理服务器的方法.分享给大家供大家参考.具体如下: # To authenticate the proxy, #you must set the Proxy-Authorization header. #You *cannot* use the form http://user:pass@proxy:port #in request.meta['proxy'] import base64 proxy_ip_port = "123.456.7

  • 尝试使用Python多线程抓取代理服务器IP地址的示例

    这里以抓取 http://www.proxy.com.ru 站点的代理服务器为例,代码如下: #!/usr/bin/env python #coding:utf-8 import urllib2 import re import threading import time import MySQLdb rawProxyList = [] checkedProxyList = [] #抓取代理网站 targets = [] for i in xrange(1,42): target = r"htt

  • 尝试用最短的Python代码来实现服务器和代理服务器

    一个最简单的服务器 Python拥有这种单独起一个服务器监听端口的能力,用标准库的wsgiref就行. from wsgiref.simple_server import make_server def simple_app(environ, start_response): status = '200 OK' response_headers = [('Content-type','text/plain')] start_response(status, response_headers) r

  • python实现通过代理服务器访问远程url的方法

    本文实例讲述了python实现通过代理服务器访问远程url的方法.分享给大家供大家参考.具体如下: import urllib proxies = {'http' : 'http://proxy:80'} urlopener = urllib.FancyURLopener(proxies) htmlpage = urlopener.open('http://www.baidu.com') data = htmlpage.readlines() print data 希望本文所述对大家的Pytho

  • Python实现简单的代理服务器

    本文实例讲述了Python实现简单的代理服务器.分享给大家供大家参考.具体如下: 具备简单的管理功能,运行后 telnet localhost 9000 端口可以进行管理主要功能就是做包转发,如果有一个桥服务器,可以用来外网访问内网用,还是很管用的 #/bin/env python #coding:utf-8 import socket,select,sys,time import thread s_list = [] def loop(cs,addr,s_ip,s_port): print '

  • python实现简单的TCP代理服务器

    本文实例讲述了python实现简单的TCP代理服务器的方法,分享给大家供大家参考. 具体实现代码如下: # -*- coding: utf-8 -*- ''' filename:rtcp.py @desc: 利用python的socket端口转发,用于远程维护 如果连接不到远程,会sleep 36s,最多尝试200(即两小时) @usage: ./rtcp.py stream1 stream2 stream为:l:port或c:host:port l:port表示监听指定的本地端口 c:host

  • Python简单实现的代理服务器端口映射功能示例

    本文实例讲述了Python简单实现的代理服务器端口映射功能.分享给大家供大家参考,具体如下: 一 代码 1.模拟服务端代码 import sys import socket import threading #回复消息,原样返回 def replyMessage(conn): while True: data = conn.recv(1024) conn.send(data) if data.decode().lower() == 'bye': break conn.close() def ma

  • 仅用50行Python代码实现一个简单的代理服务器

    之前遇到一个场景是这样的: 我在自己的电脑上需要用mongodb图形客户端,但是mongodb的服务器地址没有对外网开放,只能通过先登录主机A,然后再从A连接mongodb服务器B. 本来想通过ssh端口转发的,但是我没有从机器A连接ssh到B的权限.于是就自己用python写一个. 原理很简单. 1.开一个socket server监听连接请求 2.每接受一个客户端的连接请求,就往要转发的地址建一条连接请求.即client->proxy->forward.proxy既是socket服务端(监

  • Python代码实现http/https代理服务器的脚本

    一个几百行代码做出http/https代理服务器的脚本,启动即可做http https透明代理使用 python proxy.py 8992 使用非阻塞io模式,性能还可以. 可以和浏览器一样保持长连接,代码有点乱,不管那么多了能跑就行 几百行代码做出http/https代理服务器代码片段 *1. * [代码] [Python]代码 #!/usr/bin/python #-*- coding:utf-8 -*- import socket, logging import select, errn

  • 三行Python代码提高数据处理脚本速度

    Python是一门非常适合处理数据和自动化完成重复性工作的编程语言,我们在用数据训练机器学习模型之前,通常都需要对数据进行预处理,而Python就非常适合完成这项工作,比如需要重新调整几十万张图像的尺寸,用Python没问题!你几乎总是能找到一款可以轻松完成数据处理工作的Python库. 然而,虽然Python易于学习,使用方便,但它并非运行速度最快的语言.默认情况下,Python程序使用一个CPU以单个进程运行.不过如果你是在最近几年配置的电脑,通常都是四核处理器,也就是有4个CPU.这就意味

  • Python 代码性能优化技巧分享

    如何进行 Python 性能优化,是本文探讨的主要问题.本文会涉及常见的代码优化方法,性能优化工具的使用以及如何诊断代码的性能瓶颈等内容,希望可以给 Python 开发人员一定的参考. Python 代码优化常见技巧 代码优化能够让程序运行更快,它是在不改变程序运行结果的情况下使得程序的运行效率更高,根据 80/20 原则,实现程序的重构.优化.扩展以及文档相关的事情通常需要消耗 80% 的工作量.优化通常包含两方面的内容:减小代码的体积,提高代码的运行效率. 改进算法,选择合适的数据结构 一个

  • 将Emacs打造成强大的Python代码编辑工具

    基本配置 Emacs本身提供了python-mode,输入M-x python-mode,就可以进入python模式.相应地,会在菜单栏出现Python菜单.当然,一般来讲,如果是.py文件打开的话,也会自动进入该模式.         不过,默认的python模式功能上面用起来还是有点弱,而且许多地方做的并不好,最好下载第三方的python模式.python-mode是一个开源项目,可以在https://launchpad.net/python-mode进行下载. 1.安装         1

  • 在Linux下调试Python代码的各种方法

    这是一个我用于调试或分析工具概述,不一定是完整全面,如果你知道更好的工具,请在评论处标记. 日志 是的,的确,不得不强调足够的日志记录对应用程序是多么的重要.您应该记录重要的东西,如果你的记录足够好的话,你可以从日志中找出问题从而节省大量的时间. 如果你曾经用print语句来调试代码现在停下吧,用logging.debug替代,开始可以慢慢来,以后完全禁用它... 追踪 有时看到程序如何被执行会很有帮助.你可以使用IDE的调试共轭ngn一步一步的运行程序,但你需要知道你要找的是什么,否则这将会是

  • 让Python代码更快运行的5种方法

    不论什么语言,我们都需要注意性能优化问题,提高执行效率.选择了脚本语言就要忍受其速度,这句话在某种程度上说明了Python作为脚本语言的不足之处,那就是执行效率和性能不够亮.尽管Python从未如C和Java一般快速,但是不少Python项目都处于开发语言领先位置. Python很简单易用,但大多数人使用Python都知道在处理密集型cpu工作时,它的数量级依然低于C.Java和JavaScript.但不少第三方不愿赘述Python的优点,而是决定自内而外提高其性能.如果你想让Python在同一

  • 100行Python代码实现自动抢火车票(附源码)

    前言 又要过年了,今年你不妨自己写一段代码来抢回家的火车票,是不是很Cool.下面话不多说了,来一起看看详细的介绍吧. 先准备好: 12306网站用户名和密码 chrome浏览器及下载chromedriver 下载Python代码,来自网络整理 [点击下载 |  本地下载 ] 代码用的Python+Splinter开发,Splinter是一个使用Python开发的开源Web应用测试工具,它可以帮你实现自动浏览站点和与其进行交互. Splinter官网:http://splinter.readth

  • 火车票抢票python代码公开揭秘!

    市场上很多火车票抢票软件大家应该非常熟悉,但很少有人研究具体是怎么实现的,所以觉得很神秘,其实很简单.下面使用Python模拟抢票程序,给大家揭秘抢票到底是怎么回事. 该代码仅供参考,主要用于大家沟通交流,禁止用于商业用途. 具体代码如下,可以修改成自己的12306用户名账号: # -*- coding: utf-8 -*- from splinter.browser import Browser from time import sleep import traceback import ti

  • 使用50行Python代码从零开始实现一个AI平衡小游戏

    集智导读: 本文会为大家展示机器学习专家 Mike Shi 如何用 50 行 Python 代码创建一个 AI,使用增强学习技术,玩耍一个保持杆子平衡的小游戏.所用环境为标准的 OpenAI Gym,只使用 Numpy 来创建 agent. 各位看官好,我(作者 Mike Shi--译者注)将在本文教大家如何用 50 行 Python 代码,教会 AI 玩一个简单的平衡游戏.我们会用到标准的 OpenAI Gym 作为测试环境,仅用 Numpy 创建我们的 AI,别的不用. 这个小游戏就是经典的

  • 使用tqdm显示Python代码执行进度功能

    在使用Python执行一些比较耗时的操作时,为了方便观察进度,通常使用进度条的方式来可视化呈现.Python中的tqdm就是用来实现此功能的. 先来看看tqdm的进度条效果: tqdm的基本用法 tqdm最主要的用法有3种,自动控制.手动控制或者用于脚本或命令行. 自动控制运行 最基本的用法,将tqdm()直接包装在任意迭代器上. from tqdm import tqdm import time text = "" for char in tqdm(["a", &

随机推荐