剖析Python的Tornado框架中session支持的实现代码

2025-02-12 08:36:56

tornado 里面没有 session？不，当然有~我知道 github 上肯定有人帮我写好了~ O(∩_∩)O~
于是乎，找到下面这个项目，用 memcached 实现 tornado 的 session。光会用可不行啊，让我们看看是怎么写的~

项目地址：tornado-memcached-sessions

让我们先从 demo 看起....

app.py 中：
首先可以注意到，这里定义了一个新的 Application 类，继承于 tornado.web.Application, 在该类的初始化方法中，设定了应用参数 settings, 之后初始化父类和 session_manager.（这是什么？暂时不管它...）

class Application(tornado.web.Application):
  def __init__(self):
    settings = dict(
      # 设定 cookie_secret, 用于 secure_cookie
      cookie_secret = "e446976943b4e8442f099fed1f3fea28462d5832f483a0ed9a3d5d3859f==78d",
      # 设定 session_secret 用于生成 session_id
      session_secret = "3cdcb1f00803b6e78ab50b466a40b9977db396840c28307f428b25e2277f1bcc",
      # memcached 地址
      memcached_address = ["127.0.0.1:11211"],
      # session 过期时间
      session_timeout = 60,
      template_path = os.path.join(os.path.dirname(__file__), "templates"),
      static_path = os.path.join(os.path.dirname(__file__), "static"),
      xsrf_cookies = True,
      login_url = "/login",
    ) 

    handlers = [
      (r"/", MainHandler),
      (r"/login", LoginHandler)
    ] 

    # 初始化父类 tornado.web.Application
    tornado.web.Application.__init__(self, handlers, **settings)
    # 初始化该类的 session_manager
    self.session_manager = session.SessionManager(settings["session_secret"], settings["memcached_address"], settings["session_timeout"])

在下面的 LoginHandler 中我们可以看到 session 的使用：

class LoginHandler(BaseHandler):
  def get(self):
    self.render("login.html") 

  def post(self):
    # 以字典的键值对形式存取
    self.session["user_name"] = self.get_argument("name")
    # 修改完要调用 session 的 save, 否则等于没有修改哦...
    self.session.save()
    self.redirect("/")

从使用来看是不是非常简洁和清晰？那么，细心的你是不是发现现在的 handler 没有继承于 tornado.web.RequestHandler？带着强烈的探（zuo）索（si）精神我们打开了 base.py。天啊，好短....（噢，你想到哪里去了...）
BaseHandler 的方法只是初始化，并重写了 get_current_user 的用于用户登录验证的方法。

class BaseHandler(tornado.web.RequestHandler):
  def __init__(self, *argc, **argkw):
    super(BaseHandler, self).__init__(*argc, **argkw)
    # 定义 handler 的 session, 注意，根据 HTTP 特点，每次访问都会初始化一个 Session 实例哦，这对于你后面的理解很重要
    self.session = session.Session(self.application.session_manager, self) 

  # 这是干嘛的？用于验证登录...请 google 关于 tornado.web.authenticated, 其实就是 tornado 提供的用户验证
  def get_current_user(self):
    return self.session.get("user_name")

看到这里，是不是心满意足？噢，我终于理解了！。。。喂，说好的探（zuo）索（si）精神呢？关键在于 session.py 啊！你一脸茫然地回过了头....

首先看看需要的库：
      pickle 一个用于序列化反序列化的库（听不懂？你直接看成和 json 一样作用就行了...）
      hmac 和 hashlib 用于生成加密字符串
      uuid 用于生成一个唯一 id
      memcache Python 的 memcache 客户端

这里面有三个类，SessionData Session 和 SessionManager。先看最简单的 SessionData。
SessionData 用于以字典的结构存储 session 数据，继承于字典，其实只比字典多了两个成员变量：

# 继承字典，因为 session 的存取类似于字典
class SessionData(dict):
  # 初始化时提供 session id 和 hmac_key
  def __init__(self, session_id, hmac_key):
    self.session_id = session_id
    self.hmac_key = hmac_key

然后就是真正的 Session 类了。Session 类继承于 SessionData, 注意，它还是十分像内置类型字典，只是重写了自己的初始化方法，并定义了 save 接口——用于保存修改后的 session 数据。

# 继承 SessionData 类
class Session(SessionData):
  # 初始化，绑定 session_manager 和 tornado 的对应 handler
  def __init__(self, session_manager, request_handler):
    self.session_manager = session_manager
    self.request_handler = request_handler 

    try:
      # 正常是获取该 session 的所有数据，以 SessionData 的形式保存
      current_session = session_manager.get(request_handler)
    except InvalidSessionException:
      # 如果是第一次访问会抛出异常，异常的时候是获取了一个空的 SessionData 对象,里面没有数据，但包含新生成的
      # session_id 和 hmac_key
      current_session = session_manager.get() 

    # 取出 current_session 中的数据，以键值对的形式迭代存下
    for key, data in current_session.iteritems():
      self[key] = data 

    # 保存下 session_id
    self.session_id = current_session.session_id
    # 以及对应的 hmac_key
    self.hmac_key = current_session.hmac_key 

  # 定义 save 方法，用于 session 修改后的保存，实际调用 session_manager 的 set 方法
  def save(self):
    self.session_manager.set(self.request_handler, self)

__init__ 方法比较难理解，基本流程是定义自己的 session_manager 和 handler 处理对象。然后通过 session_manager 获得已有的 session 数据，用这些数据初始化一个访问的用户的 session, 如果用户是第一次访问，那么他拿到的是一个新的 SessionData 对象，因为有可能是新用户，所以这里要对 session_id 和 hmac_key（什么鬼）进行赋值。
而 save 方法是提供了对修改 session 数据后的保存接口，实际是调用 session_manager 的 set 方法，具体实现先不考虑。

看到这两个类，你就应该对 session 的工作有基本理解，可以从用户访问的流程来考虑。注意 BaseHandler 这个入口，每个用户的访问都是一次 HTTP 请求。当用户第一次访问或者上一次的 session 过期了，这时用户访问时 tornado 建立了一个 handler 对象（该 handler 一定继承于 BaseHandler），并且在初始化时建立了一个 session 对象，因为是新访问，所以目前 session 里面没有数据，在之后采用键/值对的形式读写 session（不要忘了 Session 具有字典的所有操作），修改后通过 save 方法保存 session。如果用户不是新访问，那么也是按照上述的流程，不过 session 初始化时把之前的数据取出来保存在该实例中。当用户结束访问，HTTP 断开连接，handler 实例销毁，session 实例销毁（注意，是实例销毁，不是数据销毁）。

下面准备讲 SessionManager 是吧，来～一个一个函数看～

首先是初始化，设置密钥， memcache 地址，session 超时时间。

# 初始化需要一个用于 session 加密的 secret, memcache 地址, session 的过期时间
def __init__(self, secret, memcached_address, session_timeout):
  self.secret = secret
  self.memcached_address = memcached_address
  self.session_timeout = session_timeout

接着是 _fetch 方法，以 session_id 为键从 memcached 中取出数据，并用 pickle 反序列化解析数据：

# 该方法用 session_id 从 memcache 中取出数据
def _fetch(self, session_id):
  try:
    # 连接 memcache 服务器
    mc = memcache.Client(self.memcached_address, debug=0)
    # 获取数据
    session_data = raw_data = mc.get(session_id)
    if raw_data != None:
      # 为了重新刷新 timeout
      mc.replace(session_id, raw_data, self.session_timeout, 0)
      # 反序列化
      session_data = pickle.loads(raw_data)
    # 如果拿到的数据是字典形式，才进行返回
    if type(session_data) == type({}):
      return session_data
    else:
      return {}
  except IOError:
    return {}

get 经过安全检查后，以 SessionData 的形式返回 memcached 的数据（调用了 _fetch）方法。

def get(self, request_handler = None): 

  # 获取对应的 session_id 和 hmac_key
  if (request_handler == None):
    session_id = None
    hmac_key = None
  else:
    # session 的基础还是靠 cookie
    session_id = request_handler.get_secure_cookie("session_id")
    hmac_key = request_handler.get_secure_cookie("verification") 

  # session_id 不存在的时候则生成一个新的 session_id 和 hmac_key
  if session_id == None:
    session_exists = False
    session_id = self._generate_id()
    hmac_key = self._generate_hmac(session_id)
  else:
    session_exists = True 

  # 检查 hmac_key
  check_hmac = self._generate_hmac(session_id)
  # 不通过则抛出异常
  if hmac_key != check_hmac:
    raise InvalidSessionException() 

  # 新建 SessionData 对象
  session = SessionData(session_id, hmac_key) 

  if session_exists:
    # 通过 _fetch 方法获取 memcache 中该 session 的所有数据
    session_data = self._fetch(session_id)
    for key, data in session_data.iteritems():
      session[key] = data 

  return session

至于 set 方法，是为了更新 memcached 的数据。

# 设置新的 session,需要设置 handler 的 cookie 和 memcache 客户端
def set(self, request_handler, session):
  # 设置浏览器的 cookie
  request_handler.set_secure_cookie("session_id", session.session_id)
  request_handler.set_secure_cookie("verification", session.hmac_key)
  # 用 pickle 进行序列化
  session_data = pickle.dumps(dict(session.items()), pickle.HIGHEST_PROTOCOL)
  # 连接 memcache 服务器
  mc = memcache.Client(self.memcached_address, debug=0)
  # 写入 memcache
  mc.set(session.session_id, session_data, self.session_timeout, 0)

最后的两个函数，一个是生成 session_id，另一个用 session_id 与密钥加密后生成一个加密字符串，用于验证。

# 生成 session_id
def _generate_id(self):
  new_id = hashlib.sha256(self.secret + str(uuid.uuid4()))
  return new_id.hexdigest() 

# 生成 hmac_key
def _generate_hmac(self, session_id):
  return hmac.new(session_id, self.secret, hashlib.sha256).hexdigest()

我们在哪里初始化了 SessionManager 呢？还记得第一篇里面的 Application 类吗？噢...快回去翻翻。

python中requests库session对象的妙用详解

在进行接口测试的时候,我们会调用多个接口发出多个请求,在这些请求中有时候需要保持一些共用的数据,例如cookies信息. 妙用1 requests库的session对象能够帮我们跨请求保持某些参数,也会在同一个session实例发出的所有请求之间保持cookies. 举个栗子,跨请求保持cookies,在命令行上输入下面命令: # 创建一个session对象 s = requests.Session() # 用session对象发出get请求,设置cookies s.get('http://ht
Python ORM框架SQLAlchemy学习笔记之映射类使用实例和Session会话介绍

1. 创建映射类的实例(Instance) 前面介绍了如何将数据库实体表映射到Python类上,下面我们可以创建这个类的一个实例(Instance),我们还是以前一篇文章的User类为例,让我们创建User对象: 复制代码代码如下: >>> ed_user = User('ed', 'Ed Jones', 'edspassword')>>> ed_user.name'ed'>>> ed_user.password'edspassword'>&g
在Python的Django框架的视图中使用Session的方法

SessionMiddleware 激活后,每个传给视图(view)函数的第一个参数``HttpRequest`` 对象都有一个 session 属性,这是一个字典型的对象. 你可以象用普通字典一样来用它. 例如,在视图(view)中你可以这样用: # Set a session value: request.session["fav_color"] = "blue" # Get a session value -- this could be called in
剖析Python的Tornado框架中session支持的实现代码

tornado 里面没有 session?不,当然有~我知道 github 上肯定有人帮我写好了~ O(∩_∩)O~ 于是乎,找到下面这个项目,用 memcached 实现 tornado 的 session.光会用可不行啊,让我们看看是怎么写的~ 项目地址:tornado-memcached-sessions 让我们先从 demo 看起.... app.py 中: 首先可以注意到,这里定义了一个新的 Application 类,继承于 tornado.we
深入解析Python的Tornado框架中内置的模板引擎

template中的_parse方法是模板文法的解析器,而这个文件中一坨一坨的各种node以及block,就是解析结果的承载者,也就是说在经过parse处理过后,我们输入的tornado的html模板就变成了各种block的集合. 这些block和node的祖宗就是这个"抽象"类, _Node,它定义了三个方法定义,其中generate方法是必须由子类提供实现的(所以我叫它"抽象"类). 理论上来说,当一个类成为祖宗类时,必定意味着这个类包含了一些在子类中通用的行
全面剖析Python的Django框架中的项目部署技巧第1/2页

项目开始时是一个关键时刻,选择会对项目产生长期的影响.有很多关于如何开始使用Django框架的教程,但很少讨论如何专业地使用Django,或如何使用行业公认的最佳做法来确保你的项目规模的持续增长.事前的筹划让你(和所有同事的生活)在走向将来时更容易. 文章结束时,你将有一个全功能的Django 1.6项目源代码受控的所有资源(使用Git或Mercurial) 自动回归和单元测试(使用unittest库) 一个独立于特定环境的安装项目(使用virtualenv) 自动化的部署和测试(使用Fab
按日期打印Python的Tornado框架中的日志的方法

网站流量上来后,日志按天甚至小时存储更方便查看和管理,而Python的logging模块也提供了TimedRotatingFileHandler来支持以不同的时间维度归档日志. 然而根据Logging HOWTO的官方指南设置后,却发现新的日志只剩下root的,Tornado内部的logger全部没有生效. 参考stackoverflow上的一个回答,我发现下面的配置能让Tornado内部的logger也用上TimedRotatingFileHandler: # logging.yaml ver
简单介绍Python的Tornado框架中的协程异步实现原理

Tornado 4.0 已经发布了很长一段时间了, 新版本广泛的应用了协程(Future)特性. 我们目前已经将 Tornado 升级到最新版本, 而且也大量的使用协程特性. 很长时间没有更新博客, 今天就简单介绍下 Tornado 协程实现原理, Tornado 的协程是基于 Python 的生成器实现的, 所以首先来回顾下生成器. 生成器 Python 的生成器可以保存执行状态并在下次调用的时候恢复, 通过在函数体内使用 yield 关键字来创建一个生成器, 通过内置函数 next 或生
在Python的Tornado框架中实现简单的在线代理的教程

实现代理的方式很多种,流行的web服务器也大都有代理的功能,比如http://www.tornadoweb.cn用的就是nginx的代理功能做的tornadoweb官网的镜像. 最近,我在开发一个移动运用(以下简称APP)的后台程序(Server),该运用需要调用到另一平台产品(Platform)的API.对于这个系统来说,可选的一种实现方式方式是APP同时跟Server&Platform两者交互:另一种则在Server端封装掉Platform的API,APP只和Server交互.显然后一种方式
Python：Scrapy框架中Item Pipeline组件使用详解

Item Pipeline简介 Item管道的主要责任是负责处理有蜘蛛从网页中抽取的Item,他的主要任务是清晰.验证和存储数据. 当页面被蜘蛛解析后,将被发送到Item管道,并经过几个特定的次序处理数据. 每个Item管道的组件都是有一个简单的方法组成的Python类. 他们获取了Item并执行他们的方法,同时他们还需要确定的是是否需要在Item管道中继续执行下一步或是直接丢弃掉不处理. Item管道通常执行的过程有清理HTML数据验证解析到的数据(检查Item是否包含必要的字段) 检查是
python开发实例之Python的Twisted框架中Deferred对象的详细用法与实例

Deferred对象在Twsited框架中用于处理回调,这对于依靠异步的Twisted来说十分重要,接下来我们就以实例解析Python的Twisted框架中Deferred对象的用法 Deferred对象结构 Deferred由一系列成对的回调链组成,每一对都包含一个用于处理成功的回调(callbacks)和一个用于处理错误的回调(errbacks).初始状态下,deffereds将由两个空回调链组成.在向其中添加回调时将总是成对添加.当异步处理中的结果返回时,Deferred将会启动并以添加时
Python的Flask框架中的Jinja2模板引擎学习教程

Flask的模板功能是基于Jinja2模板引擎来实现的.模板文件存放在当前目前下的子目录templates(一定要使用这个名字)下. main.py 代码如下: from flask import Flask, render_template app = Flask(__name__) @app.route('/hello') @app.route('/hello/<name>') def hello(name=None): return render_template('hello.html
Python的Django框架中的Context使用

一旦你创建一个 Template 对象,你可以用 context 来传递数据给它. 一个context是一系列变量和它们值的集合. context在Django里表现为 Context 类,在 django.template 模块里. 她的构造函数带有一个可选的参数: 一个字典映射变量和它们的值. 调用 Template 对象的 render() 方法并传递context来填充模板: >>> from django.template import Context, Template &

剖析Python的Tornado框架中session支持的实现代码

相关推荐

随机推荐