python 淘宝爬虫小实例

兄弟们,双十一剁手了吗?购物虽快乐,但是别过度了,毕竟很多降价不是真的降价,眼睛擦亮了~

今天来试试爬一下某宝,这玩意学会了做外包的话,还是值几个钱的。

环境/模块介绍

python 3.8 使用的环境
pycharm 使用的编辑器
selenium 浏览器驱动的第三方模块
csv 数据保存的模块
time 时间模块, 可以用于程序的延迟
random 随机数模块

下载操作浏览器驱动的第三方模块
对应视频教程:

Python:双十火热进行中,教你带你用Python继续剁手

selenium  pip install selenium

解释我基本都写在注释了,我就偷个懒不在写了。

from selenium import webdriver
import time  # 时间模块, 可以用于程序的延迟
import random  # 随机数模块
from constants import TAO_USERNAME1, TAO_PASSWORD1
import csv  # 数据保存的模块

def search_product(keyword):
    """搜索商品数据, 登录用户"""
    driver.find_element_by_xpath('//*[@id="q"]').send_keys(keyword)
    time.sleep(random.randint(1, 3))  # 尽量避免人机检测  随机延迟

    driver.f
def parse_data():
    """解析商品数据"""
    divs = driver.find_elements_by_xpath('//div[@class="grid g-clearfx"]/div/div')  #  所有的div标签

    for div in divs:
        try:
            info = div.find_element_by_xpath('.//div[@class="row row-2 title"]/a').text
            price = div.find_element_by_xpath('.//strong').text + '元'
            deal = div.find_element_by_xpath('.//div[@class="deal-cnt"]').text
            name = div.find_element_by_xpath('.//div[@class="shop"]/a/span[2]').text
            location = div.find_element_by_xpath('.//div[@class="location"]').te'.//div[@class="pic"]/a').get_attribute('href')

            print(info, price, deal, name, location, detail_url)

            # 保存
            with open('某宝.csv', mode='a', encoding='utf-8', newline='') as f:
                csv_write = csv.writer(f)
                csv_write.writerow([info, price, deal, name, location, detail_url])
        except:
            continue

word = input('请输入你要搜索商品的关键字:')
# 创建一个浏览器
driver = webdriver.Chrome()

# selenium操作的浏览器被识别了, 无法登录
# 修改浏览器的部分属性, 绕过检测
driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument",
            {"source": """Object.defineProperty(navigator, 'webdriver', {get: () => false})"""})

# 执行自动化浏览器的操作
driver.get('https://www.taobao.com/')
driver.implicitly_wait(10)  # 设置浏览器的等待,加载数据
driver.maximize_window()  # 最大化浏览器

# 调用商品搜索的函数
search_product(word)

for page in range(100): # 012
    print(f'\n==================正在抓取第{page + 1}页数据====================')
    url = f'https://s.taobao.com/search?q=%E5%B7%B4%E9%BB%8E%E4%B8%96%E5%AE%B6&s={page * 44}'
    # 解析商品数据
    parse_data()
    time.sleep(random.randint(1, 3))  # 尽量避免人机检测  随机延迟

兄弟们快去试试吧!Python学习视频,解答,电子书都可以私信我领取

到此这篇关于python 淘宝爬虫小实例的文章就介绍到这了,更多相关python 淘宝爬虫内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • python爬虫获取淘宝天猫商品详细参数

    首先我是从淘宝进去,爬取了按销量排序的所有(100页)女装的列表信息按综合.销量分别爬取淘宝女装列表信息,然后导出前100商品的 link,爬取其详细信息.这些商品有淘宝的,也有天猫的,这两个平台有些区别,处理的时候要注意.比如,有的说"面料".有的说"材质成分",其实是一个意思,等等.可以取不同的链接做一下测试. import re from collections import OrderedDict from bs4 import BeautifulSoup

  • python爬虫爬取淘宝商品信息

    本文实例为大家分享了python爬取淘宝商品的具体代码,供大家参考,具体内容如下 import requests as req import re def getHTMLText(url): try: r = req.get(url, timeout=30) r.raise_for_status() r.encoding = r.apparent_encoding return r.text except: return "" def parasePage(ilt, html): tr

  • python爬虫爬取淘宝商品比价(附淘宝反爬虫机制解决小办法)

    因为评论有很多人说爬取不到,我强调几点 kv的格式应该是这样的: kv = {'cookie':'你复制的一长串cookie','user-agent':'Mozilla/5.0'} 注意都应该用 '' ,然后还有个英文的 逗号, kv写完要在后面的代码中添加 r = requests.get(url, headers=kv,timeout=30) 自己得先登录自己的淘宝账号才有自己登陆的cookie呀,没登录cookie当然没用 以下原博 本人是python新手,目前在看中国大学MOOC的嵩天

  • 简单的抓取淘宝图片的Python爬虫

    写了一个抓taobao图片的爬虫,全是用if,for,while写的,比较简陋,入门作品. 从网页http://mm.taobao.com/json/request_top_list.htm?type=0&page=中提取taobao模特的照片. 复制代码 代码如下: # -*- coding: cp936 -*- import urllib2 import urllib mmurl="http://mm.taobao.com/json/request_top_list.htm?type

  • python 爬虫一键爬取 淘宝天猫宝贝页面主图颜色图和详情图的教程

    实例如下所示: import requests import re,sys,os import json import threading import pprint class spider: def __init__(self,sid,name): self.id = sid self.headers = { "Accept":"text/html,application/xhtml+xml,application/xml;", "Accept-Enc

  • python爬虫爬取淘宝商品信息(selenum+phontomjs)

    本文实例为大家分享了python爬虫爬取淘宝商品的具体代码,供大家参考,具体内容如下 1.需求目标 : 进去淘宝页面,搜索耐克关键词,抓取 商品的标题,链接,价格,城市,旺旺号,付款人数,进去第二层,抓取商品的销售量,款号等. 2.结果展示 3.源代码 # encoding: utf-8 import sys reload(sys) sys.setdefaultencoding('utf-8') import time import pandas as pd time1=time.time()

  • python 淘宝爬虫小实例

    兄弟们,双十一剁手了吗?购物虽快乐,但是别过度了,毕竟很多降价不是真的降价,眼睛擦亮了~ 今天来试试爬一下某宝,这玩意学会了做外包的话,还是值几个钱的. 环境/模块介绍 python 3.8 使用的环境 pycharm 使用的编辑器 selenium 浏览器驱动的第三方模块 csv 数据保存的模块 time 时间模块, 可以用于程序的延迟 random 随机数模块 下载操作浏览器驱动的第三方模块 对应视频教程: Python:双十火热进行中,教你带你用Python继续剁手 selenium pi

  • vue实现仿淘宝结账页面实例代码

    虽然Vue最强大的是组件化开发,但是其实多页面开发也蛮适合的.下面小编给大家分享vue实现仿淘宝结账页面实例代码,具体内容大家参考下本文. 这个demo,是小编基于之前的 vue2.0在table中实现全选和反选 文章进行更新后的demo,主要功能呢,是仿照淘宝页面的结算购物车商品时自动算出合计价格的页面,具体页面效果请看下面的动图:(如果大家发现有什么问题请及时提出帮小颖改正错误呦,谢谢啦嘻嘻) 效果图: 更新后的home.vue <template> <div class="

  • 自制Python淘宝秒杀抢购脚本双十一百分百中

    大家好,我是不学前端的前端程序员, 事情是这个样子的,前几天不是双十一预购秒杀嘛 由于我女朋友比较笨,手速比较慢,就一直抢不到,她没抢到特价商品就不开心, 她不开心,我也就不能跟着开心,就别提看6号的全球总决赛了 为了解决这个问题,就决定写一个自动定时抢购的脚本. 第一步: 首先我的思路很简单,就是让"程序"帮我们自动打开浏览器,进入淘宝,然后到购物车等待抢购时间,自动购买并支付. 第二步: 导入模块,我们需要一个时间模块,抢购的时间,还有一个Python的自动化操作. 代码如下: i

  • Python淘宝或京东等秒杀抢购脚本实现(秒杀脚本)

    目录 一.环境 二.安装 1.ChromeDriver安装 2.Seleuinm安装 3.淘宝秒杀脚本 4.京东秒杀脚本 总结 我们的目标是秒杀淘宝或京东等的订单,这里面有几个关键点,首先需要登录淘宝或京东,其次你需要准备好订单,最后要在指定时间快速提交订单. 这里就要用到一个爬虫利器Selenium,Selenium是一个用于Web应用程序测试的工具,Selenium可以直接运行在浏览器中,通过后台控制操作浏览器,完成购买操作,利用它我们可以驱动浏览器执行特定的动作,抢购脚本就是通过Selen

  • python淘宝准点秒杀抢单的实现示例

    我这里使用的chorme浏览器,使用前购物车内需要有商品 一.ChromeDriver的安装 若想使用Selenium成功调用Chrome浏览器完成相应的操作,需要通过ChromeDriver来驱动. 这里是ChromeDriver的官方下载地址. 链接:https://chromedriver.storage.googleapis.com/index.html 我们在下载之前先来确认下我们使用的Chrome浏览器版本,只需要红框内几位相同即可 根据自己操作系统选择 Python安装路径下Scr

  • python淘宝抢购脚本程序实现

    目录 一.官网下载火狐浏览器 二.下载geckodriver,并解压到火狐浏览器文件夹根目录 三.添加火狐浏览器根目录到系统环境变量 四.下载并安装python3及pycharm开发工具 五.进入淘宝 六.使用Pycharm运行脚本,新建python文件,将代码复制到文件中,并运行. 总结 最近自己在抢冰墩墩钥匙扣,发现一秒瞬间就没了.于是自己网上学习了一下,写了一个抢购脚本.亲测可用. 具体使用步骤如下: 一.官网下载火狐浏览器 二.下载geckodriver,并解压到火狐浏览器文件夹根目录

  • Python淘宝秒杀的脚本实现

    准备工作 我们需要把秒杀的商品加入购物车,因为脚本点击的是全选,所以不需要的商品要移出购物车. 过程分析 1.打开某宝网站: pq = webdriver.Chrome() pq.get("https://www.taobao.com") # 版权问题 time.sleep(3) sleep的原因是怕万一网速慢,网页加载慢. 2.扫码登陆: pq.find_element(By.LINK_TEXT, "亲,请登录").click() print(f"请尽快

  • python实现简易淘宝购物

    本文实例为大家分享了简单的python淘宝购物,供大家参考,具体内容如下 话不多说,源码附上 def jm():#定义父类界面功能 print("*****1 今日特卖*****") print("*****2 女士服装*****") print("*****3 男士服装*****") print("*****4 美食茶酒*****") print("*****5 结 算*****") def jr():#

  • 淘宝秒杀python脚本 扫码登录版

    本文实例为大家分享了python淘宝秒杀的具体代码,供大家参考,具体内容如下 # 淘宝秒杀脚本,扫码登录版 import os from selenium import webdriver import datetime import time from os import path driver = webdriver.Chrome() def login(url): # 打开淘宝登录页,并进行扫码登录 driver.get("https://www.taobao.com") tim

  • python实现简单淘宝秒杀功能

    本文实例为大家分享了Python淘宝秒杀的具体代码,供大家参考,具体内容如下 昨天茅台在线上搞秒杀,本来想着靠我惊人的手速去秒一瓶,结果. 所以痛定思痛,想想还是用脚本更靠谱.就在网上搜啊搜,看到selenium这个,顿时眼睛一亮! 整体流程是:上淘宝->找到登录按钮去登陆->在登录页选择密码登录->填入账号密码登录->跳到购物车页->点击全选按钮,等约定时间,时间到马上结算.下单. 代码: import os from selenium import webdriver i

随机推荐