2025年5月30日
摘要:
首先python根据文本内容生成doc,使用的是python-docx库,使用示例如下: from docx import Document from docx.shared import Pt, RGBColor from docx.oxml.ns import qn from docx.enum
阅读全文
posted @ 2025-05-30 15:03
落叶虽美只活一世
阅读(50)
推荐(0)
2025年5月29日
摘要:
执行代码报错:“sqlite:No module named _sqlite3” 执行环境说明 某台服务器上执行DrissionPage相关程序报错,本机没有问题。 解决说明 本机找到_sqlite3实际为python内建库,与math库在同一级,即为环境问题。重装python环境是不可选的,投机取
阅读全文
posted @ 2025-05-29 16:58
落叶虽美只活一世
阅读(91)
推荐(0)
2025年5月28日
摘要:
导包报错 from lxml_html_clean import Cleaner 解决报错:“ImportError: lxml.html.clean module is now a separate project lxml_html_clean”,pip install lxml_html_cl
阅读全文
posted @ 2025-05-28 15:37
落叶虽美只活一世
阅读(80)
推荐(0)
2025年5月27日
摘要:
DrissionPage是个强大的工具,使用DrissionPage 读取本地html 报了这个错:“DrissionPage.errors.WrongURLError 无效的url,也许要加上"http://"?”。 使用场景说明 本地windows执行没有报错,服务器centos7报这个错。测试
阅读全文
posted @ 2025-05-27 16:39
落叶虽美只活一世
阅读(32)
推荐(0)
2023年1月13日
摘要:
chrome chromedriver使用代理示例 from selenium import webdriver from selenium.webdriver import DesiredCapabilities option = webdriver.ChromeOptions() caps =
阅读全文
posted @ 2023-01-13 17:59
落叶虽美只活一世
阅读(412)
推荐(0)
摘要:
今天遇到个小问题:selenium 启动 chrome crash,报错:DevToolsActivePort file doesn't exist。 在option中添加一下几行: option = webdriver.ChromeOptions() option.add_argument('--
阅读全文
posted @ 2023-01-13 17:48
落叶虽美只活一世
阅读(7400)
推荐(0)
摘要:
需求 seo给了个开发小需求,查询搜索引擎站点后台的索引量 需求分析 难点在于怎么绕过登录 技术选型 使用selenium+firefox+geckodriver执行抓取 技术难点解析 获取cookie # 登录目标网站后,请求目标url复制请求头Cookie cookies = """xxx1=x
阅读全文
posted @ 2023-01-13 17:40
落叶虽美只活一世
阅读(181)
推荐(0)
2022年5月25日
摘要:
最近爬一个网站,用的protobuf协议,报错查了半天。报错'NoneType' object has no attribute 'message_types_by_name',最后是因为protobuf版本太高,后来重新安装指定版本3.19.3解决。
阅读全文
posted @ 2022-05-25 14:34
落叶虽美只活一世
阅读(2917)
推荐(0)
2021年4月20日
摘要:
1.Nginx HTTP模块调用的简化流程 Nginx HTTP模块调用的简化流程图如上: 1.worker进程会循环调用事件模块检测网络事件 2. 当事件模块检测到客户端发起TCP请求时,即收到SYN包了,建立TCP连接成功后,根据nginx.conf配置交由HTTP框架处理 3.HTTP框架接收
阅读全文
posted @ 2021-04-20 15:34
落叶虽美只活一世
阅读(354)
推荐(0)
2021年2月26日
摘要:
python实现斑马打印机网络打印
阅读全文
posted @ 2021-02-26 11:23
落叶虽美只活一世
阅读(3540)
推荐(1)