用python制作个论文下载器(图形化界面)

在科研学习的过程中,我们难免需要查询相关的文献资料,而想必很多小伙伴都知道SCI-HUB,此乃一大神器,它可以帮助我们搜索相关论文并下载其原文。可以说,SCI-HUB造福了众多科研人员,用起来也是“美滋滋”。

在上一篇文章中介绍了分析过程以及相应的函数代码。根据小伙伴们的反映发现了一些问题,毕竟命令框的形式用起来难免没那么“丝滑”。为了让大家更方便地使用,可以“纵享丝滑”,kimol君决定写一个图形界面(GUI):

PS.由于近期实属忙到晕厥,这是kimol君用疯狂压榨出来的时间写的,所以界面比较简陋,还望大家多多体谅哦~

一、使用说明

这个小玩意儿我们姑且称之为“SCI-Downloader”好了~
它支持单篇论文下载和批量论文下载:

  • 单篇下载:在论文标题栏输入论文的标题、DOI号或PMID号,然后选择论文存储的目录,点击开始即可!
  • 批量下载:在论文标题那里选择一个.txt文本,文本里面包含了每篇需要下载的论文,其格式如下:

然后,emmm…没有然后了~
就是这么简单快捷,还不快来试试看,等啥呢?

二、代码分析

本次图形界面的开发是基于PyQT5的,具体界面的布置这里就不过多的介绍了,主要是对其中的功能实现进行说明:

其实思路很简单,由于之前已经有了论文下载的相关函数,我们只需要定义一个Button,然后将其绑定到下载函数即可。
这有啥?完全没难度嘛。然而,你试过就会知道,界面卡顿了。这是因为下载函数所消耗的时间较长,如果让它直接在主线程里面执行的话,将会和维持界面的主程序冲突,从而出现卡顿。因此,我们将要用到QThread来执行功能函数,回调函数来进行界面更新,示意图如下:

当然,这个示意图并不是那么严谨,大家辩证地看看就好了。这么一来,每个功能即可分为三个部分:Qthread类的功能函数、回调函数、线程生成函数(该函数与Button直接绑定)。

1. 功能函数

继承Qthread类,并对其中的run函数进行重定义,这是实现具体功能的模块,并且把状态通过signal的方式传递给回调函数:

class runthread(QtCore.QThread):
 # 通过类成员对象定义信号对象
 _signal = QtCore.pyqtSignal(str)

 def __init__(self, titleText, saveText):
  super(runthread, self).__init__()
  self.titleText = titleText
  self.saveText = saveText

 def __del__(self):
  self.wait()

 def run(self):
  if self.titleText == '' or self.saveText == '': # 如果为空
   self._signal.emit('EMPTY')
   return
  headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64; rv:84.0) Gecko/20100101 Firefox/84.0',
     'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
     'Accept-Language':'zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2',
     'Accept-Encoding':'gzip, deflate, br',
     'Connection':'keep-alive',
     'Upgrade-Insecure-Requests':'1'}
  if not self.titleText.endswith('.txt'): # 如果不为目录(即单篇论文标题)
   self._signal.emit('SEARCH')
   downUrl = search_article(self.titleText)
   if downUrl == '': # 如果搜索结果为空
    self._signal.emit('NULL')
    return
   else:
    try:
     self._signal.emit('DOWNLOAD')
     res = requests.get(downUrl, headers=headers, stream=True)
     fileSize = int(res.headers['Content-Length'])
     print(fileSize)
     savedSize = 0
     saveName = change_title(self.titleText)
     with open('%s/%s.pdf'%(self.saveText,saveName), 'wb') as f:
      for chunk in res.iter_content(chunk_size=1024):
       if chunk:
        f.write(chunk)
        savedSize += len(chunk)
        progress = int(savedSize/fileSize*100)
        self._signal.emit('PRO-%d'%progress)
     self._signal.emit('SUCCESS')
    except:
     self._signal.emit('FAILED')
  else:
   paperList = read_file(self.titleText)
   if paperList == '':
    self._signal.emit('FILEWRONG')
   else:
    error = [] # 用于记录失败的论文
    self._signal.emit('BATCH-%d'%len(paperList))
    for i in range(len(paperList)):
     try:
      downUrl = search_article(paperList[i])
      print(downUrl)
      pdf = download_article(downUrl)
      saveName = change_title(paperList[i])
      with open('%s/%s.pdf'%(self.saveText,saveName), 'wb') as f:
       f.write(pdf)
     except:
      error.append(paperList[i])
     self._signal.emit('NUM-%d'%(i+1))
    with open('./errors.txt', 'w') as f:
     for e in error:
      f.write(e+'\n')
    self._signal.emit('COMPLETED-%d'%len(error))

2. 回调函数

通过监听来自功能函数的信号,对界面进行相应的更新,例如错误提醒或者下载完毕提示等等:

def call_backrun(self, msg):
 if msg == 'EMPTY':
  QtWidgets.QMessageBox.warning(self.centralwidget, '警告', '标题或目录为空!')
 if msg == 'SEARCH':
  self.runButton.setVisible(False)
  self.quitButton.setVisible(False)
  self.searchLabel.setVisible(True)
 if msg == 'NULL':
  self.runButton.setVisible(True)
  self.quitButton.setVisible(True)
  self.searchLabel.setVisible(False)
  QtWidgets.QMessageBox.information(self.centralwidget, '提示', '未搜到相应论文!')
 if msg == 'DOWNLOAD':
  self.searchLabel.setVisible(False)
  self.progressBar.setVisible(True)
  self.progressBar.setFormat('%%p')
  self.progressBar.setValue(0)
 if 'PRO' in msg:
  pro = int(msg.split('-')[-1])
  self.progressBar.setValue(pro)
 if msg == 'SUCCESS':
  self.progressBar.setVisible(False)
  self.runButton.setVisible(True)
  self.quitButton.setVisible(True)
  self.titleEdit.setText('')
  QtWidgets.QMessageBox.information(self.centralwidget, '提示', '论文下载完毕!')
 if msg == 'FAILED':
  self.progressBar.setVisible(False)
  self.runButton.setVisible(True)
  self.quitButton.setVisible(True)
  QtWidgets.QMessageBox.information(self.centralwidget, '提示', '论文下载失败!')
 if msg == 'FILEWRONG':
  QtWidgets.QMessageBox.information(self.centralwidget, '提示', '论文列表错误!')
 if 'BATCH' in msg:
  sumNumber = msg.split('-')[-1]
  self.runButton.setVisible(False)
  self.quitButton.setVisible(False)
  self.progressBar.setVisible(True)
  self.progressBar.setFormat('【%v/'+sumNumber+'】')
  self.progressBar.setMinimum(0)
  self.progressBar.setMaximum(int(sumNumber))
  self.progressBar.setValue(0)
 if 'NUM' in msg:
  num = int(msg.split('-')[-1])
  self.progressBar.setValue(num)
 if 'COMPLETED' in msg:
  errorNum = int(msg.split('-')[-1])
  self.progressBar.setVisible(False)
  self.runButton.setVisible(True)
  self.quitButton.setVisible(True)
  self.titleEdit.setText('')
  QtWidgets.QMessageBox.information(self.centralwidget, '提示', '论文下载完毕!\n(%d个失败)'%errorNum)

3. 线程生成函数

这个函数与相应的按钮(Button)绑定,当触发时即创建一个对应的功能函数线程:

def run(self):
 titleText = self.titleEdit.text()
 saveText = self.saveEdit.text()
 # 创建线程
 self.runthread = runthread(titleText, saveText)
 # 连接信号
 self.runthread._signal.connect(self.call_backrun) # 进程连接回传到GUI的事件
 # 开始线程
 self.runthread.start()

4. 效果展示

大功告成之后,点击开始按钮,一键入魂:

无数的论文正在快马加鞭地向我奔来~

写在最后

通过简单地测试,功能基本上没有太大的问题,就是界面可能相对比较简陋,后续如果有时间的话我也将持续更新,当然也欢迎各位大大提出宝贵的意见呀~

此外,为了让大家更方便地使用,我已经将代码打包exe可执行文件,双击即可开启新世界的大门,不爽吗?

下载地址:https://wws.lanzous.com/iQE7Akpafid

以上就是用python制作个论文下载器(图形化界面)的详细内容,更多关于python 论文下载器的资料请关注我们其它相关文章!

(0)

相关推荐

  • 用Python自动下载网站所有文件

    最近维基 jie mi 彻底公开了网站的全部文件,我就在想如何使用 Python 将其下载到本地永久保存,于是就有了这篇文章,写爬虫会遇到很多坑,借鉴他人经验,考虑越全面,出错的概率就越小. 假如一个网站,里面有很多链接,有指向文件的,有指向新链接的,新的链接点击进去后,仍然是有指向文件的,有指向新链接的,类似一个文件夹,里面即有文件,又有目录,目录中又有文件和目录.如何从这样的网站上下载所有的文件,并按网站的目录结构来保存这些文件呢? 关键词:Python.下载.正则表达式.递归. 按照自顶向

  • Python实现一个论文下载器的过程

    在科研学习的过程中,我们难免需要查询相关的文献资料,而想必很多小伙伴都知道SCI-HUB,此乃一大神器,它可以帮助我们搜索相关论文并下载其原文.可以说,SCI-HUB造福了众多科研人员,用起来也是"美滋滋". 然而,当师姐告诉我:"xx,可以帮我下载几篇文献嘛?".乐心助人的我自当是满口答应了,心想:"这种小事就交给我叭~" 于是乎,我收到了一个excel文档,66篇论文的列表安静地趟在里面(此刻心中碎碎念:"这尼玛,是几篇嘛...&q

  • 用python制作个视频下载器

    前言 某个夜深人静的夜晚,夜微凉风微扬,月光照进我的书房~ 当我打开文件夹以回顾往事之余,惊现许多看似杂乱的无聊代码.我拍腿正坐,一个想法油然而生:"生活已然很无聊,不如再无聊些叭". 于是,我决定开一个专题,便称之为kimol君的无聊小发明. 妙-啊~~~ 众所周知,视频是一个学习新姿势知识的良好媒介.那么,如何利用爬虫更加方便快捷地下载视频呢?本文将从数据包分析到代码实现来进行一个相对完整的讲解. 一.爬虫分析 本次选取的目标视频网站为某度旗下的好看视频: https://haok

  • Python解析m3u8拼接下载mp4视频文件的示例代码

    一.关于m3u8: m3u8是苹果公司推出一种视频播放标准,是m3u的一种,不过编码方式是utf-8,是一种文件检索格式,将视频切割成一小段一小段的ts格式的视频文件,然后存在服务器中(现在为了减少I/o访问次数,一般存在服务器的内存中),通过m3u8解析出来路径,然后去请求. 示例: #EXTM3U #EXT-X-TARGETDURATION:10 #EXTINF:9, http://data.video.iqiyi.com/videos/vts/20210301/69/b8/73ad4ef0

  • python基于paramiko库远程执行 SSH 命令,实现 sftp 下载文件

    楔子 我们使用 Python 避免不了和 Linux 打交道,而有时我们需要执行一些 shell 命令.如果在本地的话,那么可以通过调用 os.system 或者 subprocess.Popen 来执行,但如果我们希望远程执行其它机器上的 shell 命令,这个时候该怎么做呢?下面我们就来推荐一个第三方库 paramiko,看看如何使用 Python 远程操作其它机器. paramiko 网络传输是遵循协议的,比如 SSH,paramiko 则是实现了 SSHv2 协议的一个 Python 第

  • 用python制作个音乐下载器

    前言 某个夜深人静的夜晚,我打开了自己的文件夹,发现了自己写了许多似乎很无聊的代码.于是乎,一个想法油然而生:"生活已经很无聊了,不如再无聊一点叭". 说干就干,那就开一个专题,我们称之为kimol君的无聊小发明. 妙-啊~~~ 直奔主题!本文主题是用python做一个音乐下载器(MusicLover),直接上图: 想必看到这里,各位看官的脑海中已经脑补出各种JS解密,参数分析等等让初学者很头疼的东东了. 然而,我并不打算这么干~(小声嘀咕:"没想到吧") 本文很友

  • Python基于爬虫实现全网搜索并下载音乐

    现在写一篇博客总是喜欢先谈需求或者本内容的应用场景,是的,如果写出来的东西没有任何应用价值,确实也没有实际意义.今天的最早的需求是来自于如何免费[白嫖]下载全网优质音乐,我去b站上面搜索到了一个大牛做过的一个歌曲搜素神器,界面是这样的: 确实很好用的,而且涵盖了互联网上面大多数主流的音乐网站,涉及到的版本也很多,可谓大而全,但是一个技术人的追求远远不会如此,于是我就想去了解其中背后的原理,因为做过网络爬虫的人都知道,爬虫只能爬取某一页或者某些页的网站资源,所以我很好奇它背后是怎么实现的? 笔者一

  • python 制作网站小说下载器

    基本开发环境 · Python 3.6 · Pycharm 相关模块使用 目标网页分析 输入想看的小说内容,点击搜索 这里会返回很多结果,我只选择第一个 网页数据是静态数据,但是要搜索,是post请求,需要提价data参数,如下图所示: 然后通过解析网站数据,获取第一个小说i的详情页url即可 静态网页的获取,难度是不大的. def search():     search_url = 'http://www.xbiquge.la/modules/article/waps.php'     da

  • python基于tkinter制作无损音乐下载工具(附源码)

    继续写GUI,本次依然使用Tkinter设计一款图形界面,使用Tkinter做一款音乐下载软件,听起来听平常的,但是我这款软件能够下载 无损音乐下载软件,听起来不错吧,Let`s go! 一.准备工作 python Tkinter 二.预览 1.搜索 2.下载 3.结果 无损音乐就这样下载完了. 三.详细设计 这里仅展示我设计的整体思路. 四.源代码 4.1 Music_Search-v1.0.py from tkinter import * from tkinter import ttk fr

  • 用python制作个论文下载器(图形化界面)

    在科研学习的过程中,我们难免需要查询相关的文献资料,而想必很多小伙伴都知道SCI-HUB,此乃一大神器,它可以帮助我们搜索相关论文并下载其原文.可以说,SCI-HUB造福了众多科研人员,用起来也是"美滋滋". 在上一篇文章中介绍了分析过程以及相应的函数代码.根据小伙伴们的反映发现了一些问题,毕竟命令框的形式用起来难免没那么"丝滑".为了让大家更方便地使用,可以"纵享丝滑",kimol君决定写一个图形界面(GUI): PS.由于近期实属忙到晕厥,这

  • 利用Python制作百度图片下载器

    前段时间写了一个百度图片下载器,结果发现有很多人需要使用.说实话之前写的那一款百度图片下载器比较LOW,今天刚好有时间就做了一下升级. 更新了两个BUG,一个是图片下载达到几千张的时候就没有图片可以下载了.另一个是下载进度不能实时的展示出来不知道下载到什么程度了. 同样的,我们先把需要的第三方库导入进来. '''UI界面相关的库''' from PyQt5.QtWidgets import * from PyQt5.QtCore import * from PyQt5.QtGui import

  • 使用Python制作获取网站目录的图形化程序

    1.pyqt4写的界面 find_ui.py #-*- coding: utf-8 -*- from PyQt4 import QtCore, QtGui try: _fromUtf8 = QtCore.QString.fromUtf8 except AttributeError: def _fromUtf8(s): return s try: _encoding = QtGui.QApplication.UnicodeUTF8 def _translate(context, text, dis

  • 利用Python+Excel制作一个视频下载器

    说起Excel,那绝对是数据处理领域王者般的存在. 而作为网红语言Python,在数据领域也是被广泛使用. 其中Python的第三方库-xlwings,一个Python和Excel的交互工具,可以轻松地通过VBA来调用Python脚本,实现复杂的数据分析. 今天,小F就给大家介绍一个Python+Excel的项目[视频下载器]. 主要使用到下面这些Python库. import os import sys import ssl import ffmpeg import xlwings as xw

  • python实现多线程网页下载器

    本文为大家分享了python实现的一个多线程网页下载器,供大家参考,具体内容如下 这是一个有着真实需求的实现,我的用途是拿它来通过 HTTP 方式向服务器提交游戏数据.把它放上来也是想大家帮忙挑刺,找找 bug,让它工作得更好. keywords:python,http,multi-threads,thread,threading,httplib,urllib,urllib2,Queue,http pool,httppool 废话少说,上源码: # -*- coding:utf-8 -*- im

  • 利用Python多线程实现图片下载器

    目录 导语 开发工具 环境搭建 原理简介 效果展示 导语 之前有很多小伙伴说想学习一下多线程图片下载器,虽然好像已经过去很久了,不过还是上来安排一波吧.至于题目为什么说是构建一个小型数据集,因为公众号之后的文章应该还会用到它来构建一些简单的图像分类数据集,换句话说,后续一段时间,公众号会主要写一些深度学习机器学习相关的文章,下期文章揭晓具体内容. 废话不多说,让我们愉快地开始近期最后一篇爬虫文章~ 开发工具 Python版本:3.7.8 相关模块: requests模块: alive-progr

随机推荐