玖叶教程网

前端编程开发入门

2024年09月16日

爬取pexels网站获取高清原图(做成图片下载器)

#!usr/bin/env python
# -*-coding:utf-8 -*-
__author__='Charles'
__date__='2018.03.16'
import re
import os
import requests
import random
import time
class Spider():
def __init__(self):
self.keyword=raw_input(u'欢迎使用 pexels 图片搜索下载神器\n请输入搜索关键词(英文)：')
self.siteURL='https://www.pexels.com/search/'+str(self.keyword)+'/'
def getSource(self,url):
result=requests.get(url).text.encode('utf-8')
return result
#获取图片页数
def getPageNum(self):
result=self.getSource(url=self.siteURL)
pattern=re.compile('<span class="gap".*?<a href="/search/.*?>(.*?)</a> <a href="/search/.*?>(.*?)</a> <a class="next_page" rel="next"', re.S)
items=re.search(pattern,result)
if items.group(2)>=1:
print u'\n这个主题共有图片', items.group(2), u'页'
else:
print u'\n哎呀，木有您想要的图呢。。。'
return items.group(2)
#获取链接部分
def getPartLink(self,url):
result=self.getSource(url)
pattern1=re.compile(r'<img.*?data-pin-media="https://images.pexels.com/photos/(.*?)/(.*?)?w=800.*?>', re.S)
items=re.findall(pattern1, result)
return items
#保存图片入文件
def saveImage(self,detailURL,name):
fileName=name
string='F:\Desktop\code\pexels\%s\%s' % (self.path, fileName)
E=os.path.exists(string)
if not E:
try:
user_agents=['Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20130406 Firefox/23.0',
'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:18.0) Gecko/20100101 Firefox/18.0',
'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/533+ \(KHTML, like Gecko) Element Browser 5.0',
'IBM WebExplorer /v0.94', 'Galaxy/1.0 [en] (Mac OS X 10.5.6; U; en)',
'Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; WOW64; Trident/6.0)',
'Opera/9.80 (Windows NT 6.0) Presto/2.12.388 Version/12.14',
'Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) \Version/6.0 Mobile/10A5355d Safari/8536.25',
'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) \Chrome/28.0.1468.0 Safari/537.36',
'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.0; Trident/5.0; TheWorld)']
index=random.randint(0, 9)
user_agent=user_agents[index]
headers={'User_agent':user_agent}
picture=requests.get(detailURL,headers)
f=open(string, 'wb')
f.write(picture.content)
f.close()
except requests.exceptions.ConnectionError:
print 'Download error:requests.exceptions.ConnectionError'
return None
else:
print u'图片已经存在，跳过！'
return False
#创建目录
def makeDir(self, path):
self.path=path.strip()
E=os.path.exists(os.path.join('F:\Desktop\code\pexels', self.path))
if not E:
os.makedirs(os.path.join('F:\Desktop\code\pexels',self.path))
os.chdir(os.path.join('F:\Desktop\code\pexels',self.path))
print u'成功创建名为', self.path, u'的文件夹'
return self.path
else:
print u'名为', self.path, u'的文件夹已经存在...'
return False
#对一页的操作
def saveOnePage(self,oneURL):
items=self.getPartLink(oneURL)
i=1
for item in items:
#记得去掉后面的'?'
detailURL='https://static.pexels.com/photos/'+item[0]+'/'+item[1][:-1]
print u'\n', u'正在下载并保存图片',i
self.saveImage(detailURL,name=item[1][:-1])
time.sleep(0.5)
i+=1
#对多页的操作
def saveMorePage(self):
Numbers=self.getPageNum()
Num=int(raw_input(u'一页共15张图，\n请输入要下载的页数(默认页数大于等于1）：'))
Start=int(raw_input(u'请输入下载起始页数：'))
if Numbers>=1:
for page in range(Start,Start+Num):
print u'\n',u'正在获取第',page, u'页的内容'
self.url='https://www.pexels.com/search/'+str(self.keyword)+'/?page='+str(page)
self.makeDir(path=self.keyword+'Page'+str(page))
self.saveOnePage(oneURL=self.url)
time.sleep(5)
else:
return False
print u'\n',u'圆满成功!!!'
spider=Spider()
spider.saveMorePage()

2024年09月16日

持续更新 | 模糊测试工具合集，附贴心教程(二)

2024年09月16日

Python os.path模块:跨平台路径操作的全能助手

在Python编程的世界中，文件系统的操作是不可或缺的一部分。无论是开发桌面应用还是服务器端脚本，我们都需要与文件和目录进行交互。幸运的是，Python为我们提供了一个强大的工具——os.path模块，它专门用于处理路径相关的任务。本文将深入探讨os.path模块的功能，并提供一些实用的代码示例，帮助你更好地理解和使用这个模块。

2024年09月16日

一篇文章快速教你如何搭建关键字驱动自动化测试框架?

前言

上篇文章我们已经了解到了数据驱动自动化测试框架是如何构建和驱动测试的！那么这篇文章我们将了解关键字驱动测试又是如何驱动自动化测试完成整个测试过程的。关键字驱动框架是一种功能自动化测试框架，它也被称为表格驱动测试或者基于动作字的测试。关键字驱动的框架的基本工作是将测试用例分成四个不同的部分。首先是测试步骤（Test Step），二是测试步骤中的对象（Test Object），三是测试对象执行的动作(Action)，四是测试对象需要的数据（Test Data）。

2024年09月16日

使用AI写一个简单的文件备份程序

需求背景：Linux服务器上面的配置文件（nginx、nacos、k8s等，分散在不同的目录）经常会发生变动，所以需要经常备份（根据日期存到指定目录）；这样出现误操作时，还可以拯救一下。

这样的程序，本身倒是不难，关键问题是大家都很忙，不能在这个事上面浪费太多时间，要快速出活，这个时候让AI来写代码就非常方便了。

2024年09月16日

十个常见 Python 脚本是什么

Python 作为一种功能强大的编程语言，在各种领域都有着广泛的应用。以下将详细介绍十个常见的 Python 脚本及其代码示例。

如果你没有服务器，没有技术，想要配置这个可以看这个（218.0.48.3:8803），帮你提供最优解决方案。

2024年09月16日

在 Flask 中处理表单和用户输入

处理表单和用户输入是 Web 开发的一个基本方面。 Flask 是 Python 中的轻量级 WSGI Web 应用程序框架，提供了多种工具来有效管理表单和用户输入。本博客将介绍 Flask 中处理表单的基础知识，从创建 HTML 表单到处理表单数据，并且我们将提供演示来说明这些概念。

2024年09月16日

Python小工具:3秒钟将视频转换为音频

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者： pk 哥

PS：如有需要Python学习资料的小伙伴可以加点击下方链接自行获取

http://note.youdao.com/noteshare?id=3054cce4add8a909e784ad934f956cef

2024年09月16日

【办公自动化】批量将Markdown文件转换为纯文本文件

本文介绍如何将 Markdown 文件转换为纯文本文件。Markdown 是一种轻量级的标记语言，用于编写格式简单的文档。但是，有时候我们需要将 Markdown 文件转换为纯文本文件，以便进行其他处理或直接在浏览器中查看。下面介绍一种简单的方法来实现这个功能。

2024年09月16日

如何使用 Qdrant DB 创建基于向量的电影推荐系统?

如何使用 Qdrant DB 创建基于向量的电影推荐系统?

电影推荐系统

<< < 69 70 71 72 73 74 75 76 77 78 > >>

控制面板: 您好，欢迎到访网站！
登录后台查看权限

网站分类

技术精选

最新留言