- 博客(851)
- 资源 (4)
- 问答 (1)
- 收藏
- 关注
原创 Python如何合并两个Excel文件
本文介绍了两种Python合并Excel文件的方法:1)使用pandas库实现高效纵向/横向合并,适合数据清洗和大文件处理;2)使用openpyxl库保留原始格式,适合需要维护样式但代码较复杂。pandas通过concat()和merge()函数支持行/列合并,而openpyxl直接操作工作表。文章对比了两种方案的优缺点,提供了完整代码示例,并解答了常见问题,帮助用户根据数据合并需求(效率优先或格式保留)选择合适工具。
2025-08-09 22:00:41
494
原创 Python如何将图片转换为PDF格式
本文介绍了三种Python方法将图片转换为PDF: img2pdf库:适合批量转换,高效无损,支持多种图片格式; Pillow库:轻量易用,可调整分辨率和合并多张图片; PyMuPDF库:功能强大,支持自定义页面布局等高级操作。 方案对比显示,img2pdf适合快速转换,Pillow适合简单需求,PyMuPDF适合复杂定制。文中提供了完整代码示例和常见问题解答,帮助用户根据需求选择最佳方案。
2025-08-09 21:55:47
246
原创 Python合并两个PDF文件
本文介绍两种Python合并PDF的方法:1)推荐使用PyPDF2库,代码简洁高效,适合常规需求;2)pdfplumber库功能更强大但效率较低,适合复杂PDF处理。文章提供了两种方案的完整代码示例,对比了它们的特性差异,并给出高级技巧(加密文件处理、书签保留等)和最佳实践建议(分批处理、格式检查等)。最后针对常见问题提供解决方案,建议普通用户优先选择PyPDF2方案,而需要精细控制时可考虑pdfplumber方案。
2025-08-08 15:57:39
223
原创 用Python解析JavaScript代码的完整指南
本文介绍了Python解析执行JavaScript代码的多种方法及应用场景。对比了PyExecJS、js2py、PyV8和Node.js子进程等主流工具的特点与适用环境,提供了具体代码示例。内容涵盖从简单JS函数执行到处理混淆代码和模拟浏览器环境等高级应用,并给出环境配置、性能优化等常见问题的解决方案。文章建议根据需求选择工具:PyExecJS适合快速开发,js2py用于轻量级解析,PyV8处理高性能计算,Node.js子进程模拟完整浏览器环境。这些方法为Web开发、数据采集和自动化测试提供了高效的JS处理
2025-08-08 15:44:40
230
原创 python使用requests发送请求设置请求头“Accept-Encoding“: “gzip, deflate, br“失败问题
摘要:HTTP请求中的内容编码问题常因Accept-Encoding头处理不当导致。Python的requests库默认自动处理压缩响应(发送gzip, deflate头并自动解压),但手动设置该头后会禁用自动解压功能。解决方法包括:1)不设置该头由库自动处理;2)手动检测并解压响应(如gzip)。浏览器与Python的区别在于前者始终自动解压,而后者仅在默认情况下自动解压。建议优先使用默认行为,若需自定义头则需配套实现解压逻辑。
2025-08-07 16:44:34
374
原创 HTTP请求头详解:从基础到实战
本文系统解析HTTP请求头的分类、作用及最佳实践。请求头分为通用头部(如Cache-Control控制缓存)、请求专用头部(如Host指定域名)、实体头部(如Content-Type定义数据格式)。文章通过Python示例展示如何正确处理请求头,包括压缩响应和会话持久化。针对常见问题如Accept-Encoding乱码、Cookie跨域和CORS跨域请求提供解决方案,并推荐安全增强头部配置。掌握HTTP头部使用技巧能优化性能、解决网络问题、实现复杂功能并提升安全性,建议结合浏览器开发者工具加深理解。
2025-08-07 16:38:33
215
原创 python base64图片字符串如何转PIL
本文介绍了Base64图片字符串与PIL Image对象的相互转换方法。关键步骤包括:处理Base64前缀、解码数据、使用BytesIO转换为文件流、用PIL打开并转换为RGB格式,同时包含完善的异常处理。还提供了反向转换(PIL转Base64)的方法,并强调了输入验证、格式支持和内存优化等注意事项,适用于常见图片格式的处理需求。
2025-08-06 15:59:52
120
原创 python产生正弦函数并作图
本文介绍了使用Python生成可自定义参数正弦函数的方法。通过numpy和matplotlib库实现了一个custom_sine()函数,可调节振幅(max_value)、周期宽度(period_width)和采样点数(num_points)。函数基于y=A*sin(2πx/T)公式,其中A控制振幅,T控制周期长度。示例演示了如何生成振幅为3、周期为5的正弦波,并展示了不同参数波形的对比效果。实现需安装numpy和matplotlib库,适用于信号模拟、波形分析等场景,具有参数灵活可调的特点。
2025-08-06 15:57:34
141
原创 mysql查询近3年数据方法
本文介绍了查询MySQL近三年数据的两种SQL写法:一种是固定日期查询,另一种是动态获取当前日期。关键点包括使用DATE_SUB和CURDATE函数计算三年前日期,以及NOW函数获取当前时间。文章还提供了优化建议,如为时间字段添加索引或使用DATE函数简化查询。这些方法适用于需要按时间范围筛选数据的场景,例如统计报表或数据分析。
2025-08-05 15:36:00
165
原创 python字符串按照数字大小排序
Python中对数字字符串进行数值排序时,默认字典序会导致"10"排在"2"前。解决方案是使用sorted()的key参数转换为数值类型:key=int用于整数,key=float处理浮点数或混合格式。高级用法包括错误处理(try-except)和预转换优化大数据量排序。该方法保持O(n log n)时间复杂度,既能正确排序,又可保留原始字符串格式,适用于数字字符串、混合格式等场景。
2025-08-05 15:34:03
299
原创 阿里v2图像复原验证码识别
本文介绍了阿里图像复原验证码的识别解决方案,通过优化算法实现了接近100%的正确率。文章详细说明了原图识别和截图识别两种方法的实现流程,包括图片加载、base64编码转换、API接口调用等关键步骤,并提供了完整的Python示例代码。两种方法均能有效处理验证码识别需求,其中截图识别方法支持不同尺寸的图片输入。文末还给出了获取更多验证码识别技术的资源链接。
2025-08-04 15:06:54
2039
原创 支某宝中文点选图像识别
支付宝中文点选验证码识别技术分析:验证码采用散列文字排布、动态点击顺序校验和复合干扰(语义/视觉/空间干扰)设计。识别难点在于干扰元素剥离需采用Canny算子+连通域分析,时序坐标链验证需建立校验机制。技术方案包含图片预处理(尺寸/格式要求)、核心识别代码(PIL图像处理、base64编码转换)及API调用流程。实现效果可在原图上标记点击顺序,完整方案需结合自适应阈值分割和坐标缩放计算。
2025-08-04 10:03:49
472
原创 python文件批量改名
本文介绍了一个Python文件批量重命名工具,支持5种模式:顺序编号、添加前后缀、正则替换、时间戳命名和自定义函数处理。该工具通过batch_rename()函数实现,可对指定目录下的文件进行批量重命名操作,每种模式都提供示例代码。文中还给出了使用建议(如测试、备份)和扩展功能建议(如文件过滤、子目录递归处理)。该脚本灵活实用,可根据不同需求选择相应模式进行文件重命名。
2025-08-03 16:15:11
333
原创 python批量gif图片转jpg
本文介绍了使用Python将GIF转换为JPG格式的方法。通过Pillow库实现,主要功能包括:自动创建输出目录、保留原文件名、错误处理和可调节输出质量(默认为85)。程序默认提取GIF第一帧并转换为RGB模式后保存为JPG。文章还提供了扩展方案用于提取GIF所有帧,并指出JPG不支持透明背景,动态GIF会转为静态图片等注意事项。建议转换前备份原文件,如需保留动画效果可考虑输出为MP4格式。
2025-08-03 16:13:59
133
原创 Python正则表达式使用指南:从基础到实战
本文系统介绍了Python正则表达式的核心概念与实战应用。主要内容包括:正则表达式基础语法(元字符、字符集、量词等)、re模块六大核心函数详解(match/search/findall等)、三大实战案例(邮箱验证、HTML提取、电话清洗)、进阶技巧(预编译、命名分组、反向引用)以及常见错误处理(贪婪匹配、特殊字符转义)。文章配有丰富的代码示例和表格说明,适合Python开发者系统学习正则表达式,提升90%的文本处理场景应对能力。最后推荐了官方文档、在线工具和专业书籍等学习资源。
2025-08-02 22:12:41
499
1
原创 python创建一个excel文件
本文介绍两种Python创建Excel文件的方法:1)使用pandas库,适合结构化数据,通过DataFrame保存为Excel;2)使用openpyxl库,提供更底层控制,可自定义工作表和内容。两种方法都支持动态文件名生成、数据扩展和路径指定,并可通过循环批量创建文件。文中还包含异常处理等高级技巧,用户可根据数据格式需求选择合适方案。
2025-08-02 16:45:16
410
原创 python PIL图片转base64字符串
本文介绍两种Python方法将图片转为Base64字符串:1)直接读取文件,使用base64库编码;2)通过PIL库处理图片(调整尺寸、转换格式等)后再编码。详细代码展示了两种实现方式,包括生成Data URL格式。文章还说明安装依赖、格式选择、常见问题处理(透明通道、质量调整)等注意事项,适用于网页显示、API传输等场景。需安装Pillow库,可根据需求选择处理方法。
2025-08-01 15:23:11
281
原创 混元AI中文点选验证码识别
本文介绍了中文点选验证码的识别方法。通过Python代码演示了验证码识别流程:将验证码图片转换为base64编码,结合点击文本调用识别接口,获取点击坐标并在图片上标记结果。测试表明该方法的识别正确率可达100%。文中提供了完整的代码实现,包括图片处理、API调用和结果可视化步骤,并附有验证码识别服务链接。该方法适用于需要自动化处理点选验证码的场景。
2025-08-01 11:23:01
293
原创 Oracle DDL详解:从基础到实战的完整指南
本文系统介绍了Oracle数据库DDL(数据定义语言)的核心操作与应用技巧。首先概述了DDL的基本功能,包括创建、修改、删除数据库对象及权限管理。重点解析了CREATE TABLE语句的数据类型和约束类型,详细说明了ALTER TABLE、索引管理、视图操作、序列与同义词的使用方法。文章还深入探讨了高级DDL应用,如权限管理、DDL与事务的关系、元数据获取等,并提供了性能优化建议和常见错误处理方案。最后总结了Oracle DDL在实际工作中的最佳实践,强调测试验证、事务管理、元数据备份和性能分析的重要性。全
2025-07-31 17:02:24
703
原创 报错:selenium.common.exceptions.ElementNotInteractableException: Message
本文提供了6种Selenium解决元素点击失败的方法:1)显式等待元素可交互;2)通过JavaScript直接点击绕过遮挡;3)强制滚动到元素位置;4)检查处理遮挡层;5)使用ActionChains模拟点击;6)检查iframe上下文。文中给出完整代码示例,包含显式等待、滚动调整、多方式点击的组合方案,并建议验证定位器唯一性、禁用动画和调整窗口尺寸。若仍失败,建议提供URL、元素结构等详细信息进一步分析。这些方案可有效应对元素不可见、被遮挡或加载延迟等常见问题。
2025-07-31 16:58:05
306
原创 Oracle存储过程编写指南:从基础到实战的完整教程
本文全面介绍Oracle存储过程的开发与应用,涵盖基础语法到高级编程技巧。详细解析存储过程的核心价值(性能、安全、复用)、参数模式、游标使用、事务控制和动态SQL实现。提供调试优化建议和安全实践,包括权限控制与防注入措施。最后通过工资调整系统案例,展示批量处理与日志记录的实际应用。适合开发者从入门到进阶的系统学习,包含代码示例和最佳实践推荐。
2025-07-30 15:33:34
438
原创 深入解析Oracle数据库体系结构:从内存到存储的全链路揭秘
Oracle数据库体系结构由内存结构(SGA+PGA)、进程架构和存储结构三大核心组成。SGA作为共享内存区域包含缓冲池、共享池等组件;PGA为进程私有空间负责排序和会话管理。后台进程如DBWR、LGWR等协同工作保障事务处理。存储结构采用表空间-段-区-块的逻辑层级管理数据。通过UNDO/REDO机制实现事务恢复,结合锁机制保证并发控制。现代Oracle版本新增自动索引、区块链表压缩等特性,支持云环境下的多租户架构。掌握这一体系结构是进行性能调优和故障诊断的基础。
2025-07-30 15:26:50
729
原创 Oracle数据库与MySQL数据类型差异对比
摘要: Oracle与MySQL在数据类型设计上存在显著差异。数值类型方面,Oracle的NUMBER(38位)与MySQL的DECIMAL(65位)在精度和存储方式上不同;字符类型中,Oracle的VARCHAR2按字节计算,MySQL的VARCHAR按字符数计算;日期类型上,Oracle的DATE包含时分秒,MySQL的DATETIME范围更广。大对象处理上,Oracle支持128TB的BLOB,MySQL限制为4GB。迁移时需注意精度损失、编码转换和时区处理,推荐使用Oracle SQL Develo
2025-07-29 16:20:31
884
原创 Oracle数据库与MySQL语法差异对比
Oracle和MySQL在数据类型、SQL语法、事务处理等方面存在显著差异。Oracle使用NUMBER类型存储数值,支持VARCHAR2字符类型,默认READ COMMITTED隔离级别;MySQL需显式指定DECIMAL精度,推荐utf8mb4编码,默认REPEATABLE-READ隔离级别。SQL语法上,分页(LIMIT vs ROWNUM)、自增列(AUTO_INCREMENT vs IDENTITY)等语法不同。事务处理方面,MySQL支持间隙锁,Oracle采用MVCC机制。迁移时需注意数据类型
2025-07-29 15:52:02
680
原创 python图片压缩
本文介绍了使用Python的Pillow库压缩证件照的方法。通过安装Pillow库后,可运行提供的脚本实现图片压缩,支持设置压缩质量、目标大小和自动旋转处理。核心参数包括压缩质量(75-90)、宽度调整(建议800px)和子采样设置。脚本还支持精确控制文件大小和批量处理,并建议压缩前备份原图。对于专业需求可结合OpenCV,但Pillow方案已能满足大多证件照压缩场景。注意事项包括检查文字清晰度、不同背景的参数调整等。
2025-07-28 16:22:37
213
原创 阿里v2图像复原验证码正确率新突破,几乎全对
摘要:本文介绍了阿里图像复原验证码的高效识别方案,提供了原图和截图两种识别方式的Python实现代码。通过base64编码转换图片并调用API接口,系统能够准确识别验证码并返回滑动距离建议,识别正确率接近100%。代码支持图片格式转换、接口调用和结果解析,适用于不同设备和截图场景。文中包含完整的代码示例和参数说明,为验证码识别提供了实用解决方案。
2025-07-28 15:35:38
2050
原创 Oracle数据库常用语法详解
本文总结了Oracle数据库的常用语法,涵盖基础查询、数据操作、高级功能、数据库对象、性能优化和常见问题解决六大方面。内容包括SELECT语句、条件过滤、排序分页等基础操作,数据插入/更新/删除方法,连接查询、子查询和聚合函数等高级功能,以及视图、索引和存储过程的创建使用。同时提供了执行计划分析、索引优化原则和查询优化技巧,并针对空值处理、字符串和日期操作等常见问题给出解决方案。这些语法要点可帮助开发者快速掌握Oracle数据库操作,提高SQL编写和优化能力。
2025-07-27 16:51:56
254
原创 Python连接Oracle数据库
本文介绍了使用Python连接Oracle数据库的详细步骤。首先说明了oracledb驱动安装和Oracle客户端配置方法,然后演示了基础连接方式和高级功能(如连接池、数据类型处理)。针对常见问题提供了解决方案,包括DPI-1047错误、中文乱码和批量插入优化。最后给出了安全规范、连接管理和性能优化的最佳实践建议。文中包含完整的代码示例,帮助开发者快速实现Python与Oracle的交互操作。
2025-07-27 16:48:33
388
原创 MySQL查询当天数据的终极指南:从基础到性能优化
本文全面解析MySQL查询当天数据的多种实现方法及优化技巧,包括基础查询方法(CURDATE()、范围查询、BETWEEN语句)、时间类型对比(DATETIME与TIMESTAMP)、性能优化方案(索引优化、分页查询)和时区处理指南。重点推荐使用范围查询法,并详细分析了不同方法的适用场景、性能表现和索引使用情况。通过创建计算列索引、优化分页查询等实战技巧,帮助开发者提升查询效率。文章还包含完整示例、常见问题解决方案和总结对比表格,为数据库开发提供实用参考。
2025-07-26 20:35:11
438
原创 Python HTML模块详解:从基础到实战
通过本文的系统学习,您将掌握从基础HTML处理到复杂动态页面解析的完整技能链。实际开发中建议根据具体场景选择工具,并严格遵守目标网站的。
2025-07-25 15:19:26
678
原创 Python Requests-HTML库详解:从入门到实战
Requests-HTML是一个集网络请求与HTML解析于一体的Python库,它结合了Requests的易用性和Parsel的选择器功能,并内置JavaScript渲染引擎。该库支持GET/POST请求、CSS/XPath选择器、动态页面渲染、表单提交等核心功能,特别适合现代动态网页抓取。文章详细介绍了安装使用、基础操作、高级特性(如智能编码检测、连接池优化)、实战案例(豆瓣电影数据抓取)以及性能优化建议,并解答了常见问题。最新版本v0.10.0新增WebAssembly支持,优化了CSS选择器性能40%
2025-07-25 15:12:24
404
原创 Python Playwright库详解:从入门到实战
Playwright是一个由微软开发的现代化浏览器自动化库,支持通过统一API控制Chromium、Firefox和WebKit三大浏览器引擎。它具有跨浏览器兼容性、自动等待机制、强大网络控制和移动设备模拟等核心特性。安装简单,支持Python 3.7+环境,提供同步/异步双模式操作方式。核心功能包括基础页面操作、多种元素定位策略、网络请求拦截和移动设备模拟等。最佳实践建议使用Pytest框架组织测试,并提供了调试和性能优化技巧。常见问题包括权限设置、元素定位和登录认证等解决方案。Playwright凭借其
2025-07-24 16:33:55
509
原创 Python proxy_pool库详解:构建你的专属代理池
proxy_pool是一个Python开源代理池系统,能自动从20+个免费代理源采集并验证代理,通过RESTful API为爬虫提供稳定服务。核心功能包括智能代理管理、多线程验证机制和丰富的API接口。支持自定义代理源开发,提供Redis优化和性能调优建议。系统通过自动化流程降低80%以上的代理维护成本,具有模块化设计便于扩展。部署时建议结合Docker容器化和Prometheus监控。适合爬虫开发者快速集成使用。
2025-07-24 16:26:00
270
原创 Python pyppeteer库详解:从入门到反爬虫实战
Pyppeteer作为Puppeteer的Python端口,提供了强大的无头浏览器自动化功能。本文详解了其核心特性、安装使用和高级技巧,包括动态内容处理、反爬虫对抗和性能优化。通过实战案例展示如何突破知乎反爬机制,并与Selenium进行对比,突出其异步性能优势。文章还解答了常见问题,为开发者提供全面的pyppeteer使用指南,特别适合处理现代网页的动态渲染和反爬场景。
2025-07-23 15:47:49
1006
2
原创 Python curl_cffi库详解:从入门到精通
curl_cffi是一款基于libcurl的Python HTTP客户端库,通过CFFI技术绑定curl-impersonate项目,能够模拟浏览器TLS/JA3指纹和HTTP/2协议特征,有效规避反爬机制。核心功能包括:支持Chrome、Edge等主流浏览器指纹模拟;提供异步会话管理;兼容HTTP/1.1/2/3协议;开放底层libcurl参数设置。相比requests库,它在反爬能力、协议支持和异步处理方面更具优势。安装简单,支持代理配置、会话管理和WebSocket等高级特性,适用于需要浏览器级仿真的
2025-07-23 15:40:21
601
原创 ClearML库详解:从实验跟踪到模型部署的全流程管理
ClearML是一个开源的MLOps平台,提供机器学习全生命周期管理功能。核心功能包括实验管理(自动记录代码、参数和结果)、模型服务部署(支持Triton)、数据版本控制、自动化流水线编排和可视化报告。平台通过简单API实现实验参数管理、实时指标上报和模型版本控制,支持XGBoost等框架集成。典型应用涵盖从训练到部署的全流程,包括Kubernetes集成和数据追踪。最佳实践建议使用任务绑定配置类、模型注册发布和资源监控告警。平台还提供故障排查工具,如任务清理和错误回退机制,帮助用户高效管理机器学习项目。
2025-07-22 16:47:34
361
原创 京东随机变速滑块拼图验证码识别
京东更新了滑块验证码机制,采用随机变速滑动验证码,使传统识别方法失效。文章介绍了随机变速验证码的特点(滑块与拼图移动速度无规律变化),并提供了应对方案:1)通过训练模型实现99%识别准确率;2)基于DrissionPage开发了通用解决方案,通过修改源代码新增变速滑动对齐功能。实战代码展示了如何获取验证码图片、识别真实滑动距离,并实现精准拖动。该方案突破了传统匀速验证码的识别限制,适用于京东新版随机变速验证码场景。
2025-07-22 09:00:00
1808
1
原创 Python Locust库详解:从入门到分布式压力测试实战
摘要:本文全面介绍Locust负载测试工具,涵盖其核心优势、环境配置、分布式测试及性能分析。Locust基于Python协程架构,支持复杂脚本编写和分布式扩展,通过Web界面实时监控关键指标。文章详细解析用户行为定义、任务集实现,提供分布式部署方案和结果分析技巧,包含RPS、响应时间等核心指标解读。同时分享数据驱动测试、资源监控等最佳实践,并针对连接错误、内存泄漏等常见问题给出解决方案。最后展望Kubernetes集成和AI测试等发展方向,为构建高性能系统提供完整的压力测试方法论。
2025-07-21 16:33:06
436
原创 阿里v2图像复原验证码正确率新突破,几乎全对
阿里图像复原验证码识别方案实现高效破解。该方案通过改进算法模型,达到接近100%的正确率,支持原图和手机截图两种识别方式。原图识别需分别处理背景图和滑块图,通过base64编码传输至接口;截图识别则通过统一缩放处理不同尺寸的图片。两种方式均返回精确的滑动距离建议,并采用变速滑动机制增强安全性。方案提供完整的Python实现代码,包括图片编码处理、API请求等关键步骤,有效提升了验证码识别的效率和准确性。
2025-07-21 09:21:19
696
原创 Python适配器模式详解:让不兼容的接口协同工作
适配器模式是一种结构型设计模式,用于解决接口不兼容问题。它通过创建中间层(适配器)将不兼容的接口转换为客户端期望的接口,类似于电源适配器的功能。模式包含目标接口、被适配者和适配器三个核心组件,支持通过类继承或对象组合两种实现方式。适配器模式适用于系统集成、第三方库适配和接口标准化等场景,能提高代码复用性但可能增加系统复杂度。使用时应注意保持适配器精简、明确适配边界,并遵循命名规范。该模式特别适合在Python等动态语言中实现,可通过各种灵活方式解决接口兼容性问题。
2025-07-20 23:31:16
1063
python中PIL图片转base64的方法
2023-04-18
中国执行信息公开网验证码训练集18000个.zip
2019-09-30
DataX_Python3.zip
2019-09-30
Centos9安装英伟达3070显卡驱动问题
2024-11-04
keras模型显存消耗问题
2023-10-11
keras使用cnn+ctc训练不定长数字识别问题
2023-05-15
前端等待旋转图片边缘有白边
2022-06-15
TA创建的收藏夹 TA关注的收藏夹
TA关注的人