0

0

如何利用 MutationObserver 实时过滤第三方脚本向网页注入的非法广告节点

舞夢輝影

舞夢輝影

发布时间:2026-04-21 23:22:26

|

231人浏览过

|

来源于php中文网

原创

应精准监听高危广告容器节点而非整个body,用querySelector定位data-ad-container等稳定属性,动态节点需先监听body再切换目标;过滤addedNodes中非元素节点,用matches匹配广告特征并深入查询子节点;attributeFilter限定class/style/hidden,修复前断开observer,优先textContent清空或setAttribute标记移除。

如何利用 mutationobserver 实时过滤第三方脚本向网页注入的非法广告节点

能实时过滤,但必须放弃“监听整个 body”这种懒办法——否则不是漏报就是自己先被拖垮。

只 observe 真正高危的容器节点

第三方广告脚本不会随机往 document.body 里撒节点,它们有固定落点:比如 #ad-banner.sidebar-ads[data-ad-slot]。盲目监听 document.body 会捕获 Vue/React 的 diff 更新、浏览器扩展注入、甚至你自己加的调试节点,回调频次飙升,CPU 占用直线上升。

应该这样做:

  • document.querySelector 精准定位已知广告挂载点,优先选带 data- 前缀的稳定属性(如 data-ad-container),避开含哈希或时间戳的 class
  • 若容器动态生成(如 SPA 路由切换后才出现),先监听 document.body 一次,等目标节点出现后立即 observer.disconnect(),再换绑到该节点上
  • 多个广告区就建多个 MutationObserver 实例,别塞进一个回调里硬扛

childList + subtree 必开,但 addedNodes 要严格过滤

广告注入最常见手法是 appendChildinsertAdjacentHTMLdocumentFragment 批量挂载,这些都会触发 childList 类型变更;而 subtree: true 是为了捕获深层嵌套的广告(比如客服浮窗里又嵌了个 taboola 推荐栏)。

mutation.addedNodes 里混着文本节点、注释节点、甚至你自己的修复节点——不筛干净就会误删、死循环:

  • 遍历前先用 node.nodeType === Node.ELEMENT_NODE 过滤,跳过所有 TEXT_NODE(值为 3)和 COMMENT_NODE(值为 8)
  • node.matches() 匹配高危特征:script[src*="ad"]iframe[src*="taboola"][id^="google_ads"].zalo-ads
  • 对疑似节点再向内查一层:node.querySelector('img[alt*="advert"]')node.querySelector('[data-track="ad-click"]'),比只看外层 class 更可靠

attributes 监听要设 attributeFilter,避免 style/class 滥用

很多广告 SDK 不直接插 DOM,而是偷偷改已有节点的 style(设 display: none 隐藏原文)或 class(加 hidden-ad 类伪装)。但全开 attributes: true 会让每个 class 切换都进回调,性能损失超 30%。

Memo AI
Memo AI

AI音视频转文字及字幕翻译工具

下载

正确做法是:

  • 只监听关键属性:attributes: true + attributeFilter: ['class', 'style', 'hidden']
  • 在回调里检查 mutation.attributeName 是否为 'style',再读 getComputedStyle(mutation.target).display,而不是依赖 mutation.target.style.display(可能为空)
  • 遇到 class 变更,用 mutation.target.classList.contains('ad-hide') 判断,别用字符串匹配(易误伤)

修复操作必须断开观察器,且避免 replaceWith 引发重绘抖动

在回调里直接调 node.remove()node.replaceWith() 会再次触发 MutationObserver,形成死循环。更糟的是,replaceWith 会强制重绘整段 DOM,页面卡顿明显。

安全执行的关键是:

  • 进回调第一句就 observer.disconnect(),修复完再 observer.observe(target, config) 重新绑定
  • 优先用 node.textContent = '' 清空文本类广告,比 innerHTML = '' 更轻量
  • 对 iframe/script 类节点,用 node.setAttribute('data-blocked', 'true') 标记后移除,方便后续审计日志追溯

真正难的不是写几行 MutationObserver,而是判断「这个节点到底是不是广告」——它可能没 class、没 id、src 是 base64 编码的,甚至藏在 shadow DOM 里。这时候靠规则已经不够,得结合首次加载时的 DOM 快照做 diff,或者引入轻量级 ML 特征(比如节点深度、子元素密度、文本熵值),但那是另一层问题了。

相关标签:

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

通义千问
通义千问

阿里巴巴推出的全能AI助手

Claude
Claude

Anthropic发布的与ChatGPT竞争的聊天机器人

Cursor
Cursor

一个新的IDE,使用AI来帮助您重构、理解、调试和编写代码。

Hermes Agent
Hermes Agent

一位与您共同成长的Agent

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
js获取数组长度的方法
js获取数组长度的方法

在js中,可以利用array对象的length属性来获取数组长度,该属性可设置或返回数组中元素的数目,只需要使用“array.length”语句即可返回表示数组对象的元素个数的数值,也就是长度值。php中文网还提供JavaScript数组的相关下载、相关课程等内容,供大家免费下载使用。

859

2023.06.20

js刷新当前页面
js刷新当前页面

js刷新当前页面的方法:1、reload方法,该方法强迫浏览器刷新当前页面,语法为“location.reload([bForceGet]) ”;2、replace方法,该方法通过指定URL替换当前缓存在历史里(客户端)的项目,因此当使用replace方法之后,不能通过“前进”和“后退”来访问已经被替换的URL,语法为“location.replace(URL) ”。php中文网为大家带来了js刷新当前页面的相关知识、以及相关文章等内容

450

2023.07.04

js四舍五入
js四舍五入

js四舍五入的方法:1、tofixed方法,可把 Number 四舍五入为指定小数位数的数字;2、round() 方法,可把一个数字舍入为最接近的整数。php中文网为大家带来了js四舍五入的相关知识、以及相关文章等内容

948

2023.07.04

js删除节点的方法
js删除节点的方法

js删除节点的方法有:1、removeChild()方法,用于从父节点中移除指定的子节点,它需要两个参数,第一个参数是要删除的子节点,第二个参数是父节点;2、parentNode.removeChild()方法,可以直接通过父节点调用来删除子节点;3、remove()方法,可以直接删除节点,而无需指定父节点;4、innerHTML属性,用于删除节点的内容。

500

2023.09.01

JavaScript转义字符
JavaScript转义字符

JavaScript中的转义字符是反斜杠和引号,可以在字符串中表示特殊字符或改变字符的含义。本专题为大家提供转义字符相关的文章、下载、课程内容,供大家免费下载体验。

700

2023.09.04

js生成随机数的方法
js生成随机数的方法

js生成随机数的方法有:1、使用random函数生成0-1之间的随机数;2、使用random函数和特定范围来生成随机整数;3、使用random函数和round函数生成0-99之间的随机整数;4、使用random函数和其他函数生成更复杂的随机数;5、使用random函数和其他函数生成范围内的随机小数;6、使用random函数和其他函数生成范围内的随机整数或小数。

1264

2023.09.04

如何启用JavaScript
如何启用JavaScript

JavaScript启用方法有内联脚本、内部脚本、外部脚本和异步加载。详细介绍:1、内联脚本是将JavaScript代码直接嵌入到HTML标签中;2、内部脚本是将JavaScript代码放置在HTML文件的`<script>`标签中;3、外部脚本是将JavaScript代码放置在一个独立的文件;4、外部脚本是将JavaScript代码放置在一个独立的文件。

946

2023.09.12

Js中Symbol类详解
Js中Symbol类详解

javascript中的Symbol数据类型是一种基本数据类型,用于表示独一无二的值。Symbol的特点:1、独一无二,每个Symbol值都是唯一的,不会与其他任何值相等;2、不可变性,Symbol值一旦创建,就不能修改或者重新赋值;3、隐藏性,Symbol值不会被隐式转换为其他类型;4、无法枚举,Symbol值作为对象的属性名时,默认是不可枚举的。

707

2023.09.20

phpEnv 多版本 PHP 切换与管理
phpEnv 多版本 PHP 切换与管理

系统讲解 phpEnv 的多版本 PHP 管理能力,涵盖 PHP 5.6、7.4、8.0、8.1、8.2、8.3 等多版本的下载安装与共存配置、不同站点绑定不同 PHP 版本的方法、php.ini 常用参数(内存限制/上传大小/时区/错误显示)的独立调整、PHP 扩展(Redis/Swoole/Xdebug/imagick)的安装与启用,帮助开发者灵活应对多项目多版本的开发需求。

0

2026.04.22

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送