python解析Chrome浏览器历史浏览记录和收藏夹数据

目录
  • 前言
  • (一)查询chrome数据缓存地址
  • (二)提取收藏夹数据
    • 1.文件路径
    • 2.解析代码
  • (三)查看浏览历史数据
    • 1.文件路径
    • 2.解析代码
  • (四)完整代码&测试代码
  • 总结

前言

常使用chrome浏览器作为自己的默认浏览器,也喜欢使用浏览器来收藏自己的喜欢的有用的链接,自己也做了一个记录笔记的小脚本,想扩展收录chrome浏览器收藏夹的内容,,下面,,使用python提取chrome浏览器的历史记录,以及收藏夹。

(一)查询chrome数据缓存地址

1.打开 chrome浏览器,输入 chrome://version,进入浏览器版本信息页面 2.复制页面下图,划线地址

(二)提取收藏夹数据

1.文件路径

上面我的chrome浏览器的缓存路径是:
C:\Users\Administrator\AppData\Local\Google\Chrome\User Data\Default
浏览器的收藏夹的数据,记录在Bookmarks文件里面
Bookmark文件的内容格式是json

2.解析代码

解析代码为

import os
import json
#chrome data path
path = "C:/Users/Administrator/AppData/Local/Google/Chrome/User Data/Default"
#chrome browser bookmark
class BookMark:

    def __init__(self,chromePath=path):
        #chromepath
        self.chromePath = chromePath
        #parse bookmarks
        with open(os.path.join(path,'Bookmarks'),encoding='utf-8') as f:
            bookmarks = json.loads(f.read())
        self.bookmarks = bookmarks
        #folders
        self.folders = self.get_folders()

    def get_folders(self):
        #folders
        names = [
            (i,self.bookmarks['roots'][i]['name'])
            for i in self.bookmarks['roots']
                 ]
        return names

    def get_folder_data(self,folder=0):
        return self.bookmarks['roots'][self.folders[folder][0]]['children']

    def set_chrome_path(self,chromePath):
        self.chromePath = chromePath

    def refresh(self):
        'update chrome data from chrome path'
        #parse bookmarks
        with open(os.path.join(path,'Bookmarks'),encoding='utf-8') as f:
            bookmarks = json.loads(f.read())
        self.bookmarks = bookmarks

(三)查看浏览历史数据

1.文件路径

历史数据,存储在下面的History文件里面,内容格式是sqlite的数据库文件,可以直接使用sqlite3来解析,当然也可以使用DB Browser for SQLite来图形化界面显示History sqlite数据文件。

2.解析代码

import os
import sqlite3

#chrome data path
path = "C:/Users/Administrator/AppData/Local/Google/Chrome/User Data/Default"

#History
class History:
    def __init__(self,chromePath=path):
        self.chromePath = chromePath

    def connect(self):
        self.conn = sqlite3.connect(os.path.join(self.chromePath,"History"))
        self.cousor = self.conn.cursor()

    def close(self):
        self.conn.close()

    def get_history(self):
        cursor = self.conn.execute("SELECT id,url,title,visit_count  from urls")
        rows = []
        for _id,url,title,visit_count in cursor:
            row = {}
            row['id'] = _id
            row['url'] = url
            row['title'] = title
            row['visit_count'] = visit_count
            rows.append(row)
        return rows

(四)完整代码&测试代码

import os
import sqlite3

#chrome data path
path = "C:/Users/Administrator/AppData/Local/Google/Chrome/User Data/Default"

#History
class History:
    def __init__(self,chromePath=path):
        self.chromePath = chromePath

    def connect(self):
        self.conn = sqlite3.connect(os.path.join(self.chromePath,"History"))
        self.cousor = self.conn.cursor()

    def close(self):
        self.conn.close()

    def get_history(self):
        cursor = self.conn.execute("SELECT id,url,title,visit_count  from urls")
        rows = []
        for _id,url,title,visit_count in cursor:
            row = {}
            row['id'] = _id
            row['url'] = url
            row['title'] = title
            row['visit_count'] = visit_count
            rows.append(row)
        return rows

总结

到此这篇关于python解析Chrome浏览器历史浏览记录和收藏夹数据的文章就介绍到这了,更多相关python解析Chrome浏览器内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • 如何使用Python提取Chrome浏览器保存的密码

    由于Chrome会将大量浏览数据本地保存磁盘中,在本教程中,我们将编写 Python 代码来提取 Windows 计算机上 Chrome 中保存的密码. 首先,让我们安装所需的库: pip install pycryptodome pypiwin32 打开一个新的 Python 文件,并导入必要的模块: import os import json import base64 import sqlite3 import win32crypt from Crypto.Cipher import AE

  • python用selenium打开chrome浏览器保持登录方式

    目录 导读 selenium操作浏览器 打开chrome浏览器 使用selenium打开网站 总结 导读 我们在使用selenium打开google浏览器的时候,默认打开的是一个新的浏览器窗口,而且里面不带有任何的浏览器缓存信息.当我们想要爬取某个网站信息或者做某些操作的时候就需要自己再去模拟登陆 selenium操作浏览器 这里我们就以CSDN为例,来展示如何让selenium在打开chrome浏览器的时候带上用户的登录信息 打开chrome浏览器 from selenium import w

  • python解析Chrome浏览器历史浏览记录和收藏夹数据

    目录 前言 (一)查询chrome数据缓存地址 (二)提取收藏夹数据 1.文件路径 2.解析代码 (三)查看浏览历史数据 1.文件路径 2.解析代码 (四)完整代码&测试代码 总结 前言 常使用chrome浏览器作为自己的默认浏览器,也喜欢使用浏览器来收藏自己的喜欢的有用的链接,自己也做了一个记录笔记的小脚本,想扩展收录chrome浏览器收藏夹的内容,,下面,,使用python提取chrome浏览器的历史记录,以及收藏夹. (一)查询chrome数据缓存地址 1.打开 chrome浏览器,输入

  • 使用Python解析Chrome浏览器书签的示例

    Chrome 浏览器的书签如果可以导出,并转换为我们需要的格式时,我们就可以编写各种插件来配合书签的使用. 答案显然是可以的,接下来我们以 Python 为例写一个遍历打印书签的例子 书签地址 先来说下获取书签的方法 Chrome 浏览器的书签存放位置在各个平台的区别 Mac ~/Library/Application Support/Google/Chrome/Default/Bookmarks Linux ~/.config/google-chrome/Default/Bookmarks W

  • selenium+python配置chrome浏览器的选项的实现

    1. 背景 在使用selenium浏览器渲染技术,爬取网站信息时,默认情况下就是一个普通的纯净的chrome浏览器,而我们平时在使用浏览器时,经常就添加一些插件,扩展,代理之类的应用.相对应的,当我们用chrome浏览器爬取网站时,可能需要对这个chrome做一些特殊的配置,以满足爬虫的行为. 常用的行为有: 禁止图片和视频的加载:提升网页加载速度. 添加代理:用于翻墙访问某些页面,或者应对IP访问频率限制的反爬技术. 使用移动头:访问移动端的站点,一般这种站点的反爬技术比较薄弱. 添加扩展:像

  • Layui选项卡制作历史浏览记录的方法

    在很多情况下我们需要使用到历史浏览记录这一个功能,自己制作起来有点麻烦,但是layui的element模块给我们带来了不少的功能,这个模块就是Tab选项卡,例如以下的样式. 这里是侧边导航样式的部分代码,id用于Tab的lay-id,Url_index是自定义属性,用来存放需要跳转到页面路径,span标签里的文本就是用于Tab的标题. <ul class="sub"> <li><span id="Organization" Url_in

  • python+selenium+chrome批量文件下载并自动创建文件夹实例

    实现效果:通过url所绑定的关键名创建目录名,每次访问一个网页url后把文件下载下来 代码: 其中 data[i][0].data[i][1] 是代表 关键词(文件保存目录).网站链接(要下载文件的网站) def getDriverHttp(): for i in range(reCount): # 创建Chrome浏览器配置对象实例 chromeOptions = webdriver.ChromeOptions() # 设定下载文件的保存目录为d盘的tudi目录, # 如果该目录不存在,将会自

  • Python解析JSON对象的全过程记录

    前言 本章节我们将为大家介绍如何使用 Python 语言来编码和解码 JSON 对象. json处理模块的主要任务,是将一个JSON对象,转换成Python数据类型数据进行处理,或者反之,将Python数据类型数据,转换成JSON对象(字符串流),在不同的模块或者系统间传输. 1. JSON数据格式特点 对象表示为键值对 数据由逗号分隔 花括号保存对象 方括号保存数组 { "students": [ { "name":"北山啦" , "

  • 使用Cookies保存网站历史浏览记录实例代码

    下面的代码,注意利用了cookies的多个增加判定等,学习cookies操作的朋友,非常值得一看.核心代码: 复制代码 代码如下: function glog(evt){ evt=evt?evt:window.event; var srcElem=(evt.target)?evt.target:evt.srcElement; try{ while(srcElem.parentNode&&srcElem!=srcElem.parentNode){ if(srcElem.tagName&

  • Python实时监控网站浏览记录实现过程详解

    需求: (1) 获取你对象chrome前一天的浏览记录中的所有网址(url)和访问时间,并存在一个txt文件中 (2)将这个txt文件发送给指定的邮箱地址(你的邮箱) (3)建立例行任务,每天定时自动完成这些操作,你就可以通过邮件查看你对象每天看啥了 准备 macOS Sierra Python3.6 Chrome 发送邮件的qq邮箱地址 qq邮箱授权码 SMTP服务器地址 : smtp.qq.com 接受邮件的邮箱地址 执行: (1) 首先我们用DB Browser for SQLite来看下

  • 用Python监控你的朋友都在浏览哪些网站?

    一.需求 1.获取你对象chrome前一天的浏览记录中的所有网址(url)和访问时间,并存在一个txt文件中 2.将这个txt文件发送给指定的邮箱地址(你的邮箱) 3.建立例行任务,每天定时自动完成这些操作,你就可以通过邮件查看你对象每天看啥了 二.背景 1.mac下chrome的浏览记录在哪?怎么获取网址(url)和访问时间? 答:路径:/Users/用户名/Library/Application\ Support/Google/Chrome/Default/History History:是

随机推荐