某药品监督管理局(瑞数6)逆向分析

声明

本文章中所有内容仅供学习交流,抓包内容、敏感网址、数据接口均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关,若有侵权,请联系我立即删除!

网站

aHR0cHM6Ly93d3cubm1wYS5nb3YuY24vZGF0YXNlYXJjaC9ob21lLWluZGV4Lmh0bWwjY2F0ZWdvcnk9eXA=

瑞数6补环境

关于瑞数的文章网上都挺多的了,这里就不细讲了,主要分享一下思路与方法

无限debugger

首先,先找到eval.call的地方,对自执行代码中的debugger进行替换,如:

_$hu = _$hu.replaceAll('debugger;','')

在这里插入图片描述

接着到一个debugger处,hook一下就ok了

在这里插入图片描述

(function () {
    window.setInterval=function(){};
    window.setTimeout=function(){};
    Function.prototype.__constructor_back = Function.prototype.constructor;
    Function.prototype.constructor = function () {
        if (arguments && typeof arguments[0] === 'string') {
            if ('debugger' === arguments[0]) {
                return
            }
        }
        return Function.prototype.__constructor_back.apply(this, arguments);
    }

    var _Function = Function;
    Function = function (s) {
        if (s === 'debugger') {
            console.log(s);
            return null;
        }
        return _Function(s);
    }
})()

瑞数6扣取流程

首先,先打上一个脚本断点,刷新网页后往下走拿到第一段我们所需的代码,放到本地的一个js文件中

在这里插入图片描述

再往下走拿到外链js,放到一个新的js文件中,注意不要格式化js代码,否则补环境的过程中会被检测到报错

在这里插入图片描述

再往下走拿到content值,并对这个文件进行本地替换,方便后面调试

在这里插入图片描述

这一套下来就可以开始补环境啦,补环境就不多说了,网上已经有好几套开源的补环境代码了

在这里插入图片描述

sign加密

搜索接口的请求头中还有一个sign加密,直接搜索就可以找到

在这里插入图片描述

往下跟栈发现就是一个md5加密
在这里插入图片描述

结果展示

python构造请求调用我就不展示了,没啥特别的,就直接展示结果了

在这里插入图片描述

总结

需要完整代码的可以私信我,逆向分析中有任何疑问也可以私信我一起讨论学习,谢谢大家!!!

爬虫(Web Crawler)是一种自动化程序,用于从互联网上收集信息。其主要功能是访问网页、提取数据并存储,以便后续分析或展示。爬虫通常由搜索引擎、数据挖掘工具、监测系统等应用于网络数据抓取的场景。 爬虫的工作流程包括以下几个关键步骤: URL收集: 爬虫从一个或多个初始URL开始,递归或迭代地发现新的URL,构建一个URL队列。这些URL可以通过链接分析、站点地图、搜索引擎等方式获取。 请求网页: 爬虫使用HTTP或其他协议向目标URL发起请求,获取网页的HTML内容。这通常通过HTTP请求库实现,如Python中的Requests库。 解析内容: 爬虫对获取的HTML进行解析,提取有用的信息。常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用的存储形式包括关系型数据库、NoSQL数据库、JSON文件等。 遵守规则: 为避免对网站造成过大负担或触发反爬虫机制,爬虫需要遵守网站的robots.txt协议,限制访问频率和深度,并模拟人类访问行为,如设置User-Agent。 反爬虫应对: 由于爬虫的存在,一些网站采取了反爬虫措施,如验证码、IP封锁等。爬虫工程师需要设计相应的策略来应对这些挑战。 爬虫在各个领域都有广泛的应用,包括搜索引擎索引、数据挖掘、价格监测、新闻聚合等。然而,使用爬虫需要遵守法律和伦理规范,尊重网站的使用政策,并确保对被访问网站的服务器负责。
### 瑞数6 Hook Cookie处理方法 当面对瑞数6这类高级别的防护机制时,Cookie的处理变得尤为复杂。由于瑞数采用动态安全技术来不断改变服务器的行为模式,使得传统的静态分析难以奏效[^5]。 #### 动态封装与验证的影响 瑞数的安全体系中包含了动态封装和动态验证两项关键技术。这意味着每次HTTP请求中的某些部分会被随机化或加密,特别是涉及到身份认证的信息如Cookies。这不仅增加了直接读取和解析Cookie难度,也意味着任何试图绕过此过程的操作都可能触发额外的安全检查并最终导致412错误响应。 #### 实施解决方案 为了有效应对这一挑战,在尝试获取受保护资源前需确保: - **保持会话一致性**:维持浏览器模拟器内的持久连接,并尽可能模仿真实用户的交互习惯。 - **更新必要的头部字段**:除了标准的User-Agent外,还需关注其他潜在敏感项,比如Referer、Origin等,因为它们也可能被纳入到反爬虫逻辑之中[^1]。 - **利用自动化工具辅助开发**:借助Selenium WebDriver或其他支持JavaScript执行环境的库来进行页面加载后的DOM操作以及事件监听,从而更自然地融入目标站点的工作流内[^3]。 ```python from selenium import webdriver import time options = webdriver.ChromeOptions() driver = webdriver.Chrome(chrome_options=options) try: driver.get('https://example.com') # 执行登录或者其他前置动作 cookies = driver.get_cookies() # 获取当前有效的cookies列表 for cookie in cookies: print(f"{cookie['name']}={cookie['value']}") finally: driver.quit() ``` 上述代码片段展示了如何使用Python绑定版Selenium WebDriver完成一次完整的Web浏览周期,期间可以方便地提取出所有已设置好的Cookie键值对以便后续重用。
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值