使用Windbg分析多线程死锁项目实战问题分享

目录

1、问题描述

2、使用.effmach x86命令切换到32位上下文

3、切换到UI线程,发现UI线程死锁了

4、使用!locks命令查看临界区锁的详细信息,遇到了问题

5、使用dt命令查看临界区对象信息,找到发生死锁的多个线程

6、用户态锁与内核态锁

7、最后


C++软件异常排查从入门到精通系列教程(核心精品专栏,订阅量已达8000多个,欢迎订阅,持续更新...)https://blog.csdn.net/chenlycly/article/details/125529931C/C++实战专栏(重点专栏,专栏文章已更新500多篇,订阅量已达6000多个,欢迎订阅,持续更新中...)https://blog.csdn.net/chenlycly/article/details/140824370C++ 软件开发从入门到实战(重点专栏,专栏文章已更新300多篇,欢迎订阅,持续更新中...)https://blog.csdn.net/chenlycly/category_12695902.htmlVC++常用功能开发汇总(专栏文章列表,欢迎订阅,持续更新...)https://blog.csdn.net/chenlycly/article/details/124272585C++软件分析工具从入门到精通案例集锦(专栏文章,持续更新中...)https://blog.csdn.net/chenlycly/article/details/131405795开源组件及数据库技术(专栏文章,持续更新中...)https://blog.csdn.net/chenlycly/category_12458859.html网络编程与网络问题分享(专栏文章,持续更新中...)https://blog.csdn.net/chenlycly/category_2276111.html       最近项目中又遇到了多线程死锁的问题,导出了dump文件,事后用Windbg详细分析了一下。本文详细讲述一下这个多线程死锁问题的完整分析与排查过程,以供借鉴或参考。

1、问题描述

       测试同事在测试新版本软件(新需求迭代,开发了新版本),问题软件终端以SIP协议入会,会议中发起桌面共享,然后测试同事去忙其他事情,20分钟后点击停止发送桌面共享,然后UI界面不能正常显示,且窗口不可点击,估计是UI线程卡死了。

       将Windbg附加到软件进程上,切换到0号UI线程,查看函数调用堆栈,显示线程卡在获取临界区锁的接口上,所以可以确定是UI线程和其他线程发生死锁卡死了。因为调试中的Windbg中输入命令很卡,所以直接到Windows任务管理中导出了软件进程的dump转储文件。因为当前软件不是崩溃闪退,是多线程死锁引发卡死,所以进程还在的,可以从任务管理器中导出dump文件。

       从Windows任务管理器中导出dump文件,是生成dump文件的方式之一,生成dump文件有多种方式。关于dump文件的分类以及生成dump文件的多种方式,可以查看我的文章:

【C++软件调试技术】dump文件类型与dump文件生成方法详解https://blog.csdn.net/chenlycly/article/details/144424512

2、使用.effmach x86命令切换到32位上下文

        从任务管理器中导出的dump文件,用Windbg打开,默认是64位上下文,查看线程函数调用堆栈,显示的堆栈不是正常的堆栈(堆栈中显示的函数不是代码中的函数接口),如下:

而我们的软件是32位的,需要使用.effmach x86命令切换到32位上下文。切换后就可以看到正常的函数调用堆栈,可以看到代码中调用的接口。

       关于使用Windbg分析dump文件的方法与一般步骤,此处不再赘述,可以查看我之前写的文章:

使用Windbg分析dump文件定位软件异常的方法与操作步骤https://blog.csdn.net/chenlycly/article/details/146005441       有时我们需要将Windbg附加到目标进程上进行动态调试,如何使用Windbg进行动态调试,可以查看我之前写的文章:

使用Windbg调试目标进程排查C++软件异常的一般步骤与要点分享https://blog.csdn.net/chenlycly/article/details/145826705

3、切换到UI线程,发现UI线程死锁了

       因为UI界面卡死堵塞了,所以初步怀疑可能是UI线程发生死锁了。当然导致线程卡死,也可能是代码中发生死循环导致函数一直不返回引起的。于是使用~0s命令切换到UI线程,输入kn查看UI线程的函数调用堆栈,如下:

从堆栈中可以看出,UI线程调用了RtlEnterCriticalSection要获取临界区锁,然后最终卡在等待临界区锁的接口NtWaitForAlertByThreadId上了。


       在这里,给大家重点推荐一下我的几个热门畅销专栏,欢迎订阅:(博客主页还有其他专栏,可以去查看)

专栏1:该精品技术专栏的订阅量已达到10000多个,专栏中包含大量项目实战分析案例,有很强的实战参考价值,广受好评!专栏文章持续更新中,已经更新到210篇以上!欢迎订阅!)

C++软件调试与异常排查从入门到精通系列文章汇总https://blog.csdn.net/chenlycly/article/details/125529931

本专栏根据多年C++软件异常排查的项目实践,系统地总结了引发C++软件异常的常见原因以及排查C++软件异常的常用思路与方法详细讲述了C++软件的调试方法与手段详细介绍分析C++软件问题的常用分析工具,以图文并茂的方式给出具体的项目问题实战分析实例(详细讲述分析排查过程,很有实战参考价值),带领大家逐步掌握C++软件调试与异常排查的相关技术,适合基础进阶和想做技术提升的相关C++开发人员!

考察一个开发人员的水平,一是看其编码及设计能力,二是要看其软件调试能力!所以软件调试能力(排查软件异常的能力)很重要,必须重视起来!能解决一般人解决不了的问题,既能提升个人能力及价值,也能体现对团队及公司的贡献!

专栏中的文章都是通过项目实战总结出来的,包含大量项目问题实战分析案例,有很强的实战参考价值!专栏文章还在持续更新中,预计文章篇数能更新到300篇以上!

专栏2:(本专栏涵盖了C++多方面的内容,是当前重点打造的专栏,订阅量已达8000多个,专栏文章已经更新到500多篇,持续更新中...)

C/C++实战进阶(专栏文章,持续更新中...)https://blog.csdn.net/chenlycly/category_11931267.html

以多年的开发实战为基础,总结并讲解一些的C/C++基础与项目实战进阶内容,以图文并茂的方式对相关知识点进行详细地展开与阐述!专栏涉及了C/C++领域多个方面的内容,包括C++基础及编程要点(模版泛型编程、STL容器及算法函数的使用等)、数据结构与算法C++11及以上新特性(开源代码中可能会用到很多新特性(比如WebRTC开源库),日常编码中也会用到部分新特性,面试时也会频繁地涉及到,学习新特性很有必要)、常用C++开源库的介绍与使用(比如SQLite、libcurl、libwebsockets、libevent、jsoncpp/RapidJson、Redis、RabbitMQ、MongoDB、MQTT、ZooKeeper、OpenCV、FFmpeg、SDL、GStreamer、Live555、ReactOS等)、代码分享(调用系统API、使用开源库)、常用编程技术(动态库、多线程、多进程、数据库及网络编程等)、软件UI编程(Win32/duilib/QT/MFC)、C++软件调试技术(引发C++软件异常的常见原因分析与总结、排查C++软件异常的手段与方法、分析C++软件异常的基础知识、使用常用软件分析工具分析C++软件问题、多个项目实战问题分析案例分享等)、设计模式(单例模式、工厂模式、观察者模式、状态模式等)、网络基础知识与网络问题分析进阶内容(实战问题分析实例分享)等。本专栏的内容都是建立在项目实践的基础上,来源于项目实战,服务于项目实战,很有实战参考价值!

专栏3:  

C++常用软件分析工具从入门到精通案例集锦汇总(专栏文章,持续更新中...)https://blog.csdn.net/chenlycly/article/details/131405795

常用的C++软件辅助分析工具有SPY++、PE工具、Dependency Walker、GDIView、Process Explorer、Process Monitor、API Monitor、Clumsy、Windbg、IDA Pro等,本专栏详细介绍如何使用这些工具去巧妙地分析和解决日常工作中遇到的问题,很有实战参考价值!

专栏4:   

VC++常用功能开发汇总(专栏文章,持续更新中...)https://blog.csdn.net/chenlycly/article/details/124272585

将10多年C++开发实践中常用的功能,以高质量的代码展现出来。这些常用的高质量规范代码,可以直接拿到项目中使用,能有效地解决软件开发过程中遇到的问题。

专栏5: 

C++ 软件开发从入门到精通(专栏文章,持续更新中...)https://blog.csdn.net/chenlycly/category_12695902.html

根据多年C++软件开发实践,详细地总结了C/C++软件开发相关技术实现细节,分享了大量的实战案例,很有实战参考价值。


4、使用!locks命令查看临界区锁的详细信息,遇到了问题

       输入kv命令,将堆栈中传入的参数值打印出来,如下所示:

对于临界区对象锁,调用的是RtlEnterCriticalSection,传入的是临界区结构体CRITICAL_SECTION对象地址,所以UI线程等待的临界区对象地址就是堆栈中的参数值087d89f0。

       于是输入命令!locks,查看当前临界区对象信息,看看087d89f0临界区锁被哪个线程占用了。输入后提示:

提示没法解析ntdll.dll库中的RtlCriticalSectionList接口,应该是没有设置系统pdb下载地址的问题。于是将微软系统库pdb在线下载地址srv*f:\mss0616*http://msdl.microsoft.com/download/symbols设置到windbg中,重新输入!locks,结果还是提示有问题:

没法读取dump文件中的内存,当前dump文件中的内存数据不全?奇怪了,当前的dump文件是从资源管理器中导出的,应该是全dump文件,咋还没法读取内存呢?难道从正在调试的Windbg中导出的dump文件才是包含所有内存的dump文件?让测试同事那边把Windbg附加到程序进程中重新复现一下,然后从正在调试的Windbg中导出dump文件再分析一下?

       关于pdb符号文件以及如何使用pdb符号文件,可以查看我之前写的文章:

【C++软件调试技术】什么是pdb文件?如何使用pdb文件?哪些工具需要使用pdb文件?https://blog.csdn.net/chenlycly/article/details/140742876

5、使用dt命令查看临界区对象信息,找到发生死锁的多个线程

       既然!locks命令没法查看到当前软件进程中的临界区对象信息,我们可以尝试使用dt命令看一下。我们上面已经知道UI线程在等待临界区锁087d89f0(临界区结构体CRITICAL_SECTION对象地址),可以使用“dt RTL_CRITICAL_SECTION 087d89f0”命令,把地址087d89f0当成RTL_CRITICAL_SECTION结构体对象的首地址,从而获取到该地址对应的结构体对象的字段值,如下所示:

其中的OwningThread字段就是当前临界区锁被哪个线程占用了(还没释放)。因为占用该临界区锁的线程没有释放锁,导致UI线程一直获取不到锁,一直在等待,产生死锁。

       OwningThread字段值 0x00003bc8就是线程id,于是使用~*命令,将当前进程中的所有信息打印出来:

找到线程id为0x00003bc8的线程对应的线程号,对应38号线程。

       于是使用~38s命令,切换到38号线程,使用kn命令将该线程的函数调用堆栈打印出来,看看为什么占用了临界区锁087d89f0没有释放。38号线程的函数调用堆栈如下:

38号线程也卡住了,卡在NtWaitForSingleObject接口上,沿着调用堆栈向上看,是在等待mutex互斥量锁。38号线占用了临界区锁087d89f0,因为38号线程在等待另一个mutex互斥量锁,所以没有释放临界区锁087d89f0,所以导致UI线程一直拿不到临界区锁087d89f0产生了堵塞卡死。至于38号线一直在等待mutex互斥量锁,肯定这个互斥量锁被第三个线程占用了,导致38号线程卡死了。

6、用户态锁与内核态锁

       本案例中涉及到的锁有临界区和mutex互斥锁,前者是用户态锁,后者是内核态锁。

       用于多线程之间同步的常用锁有临界区、事件、信号量和互斥量等,其中临界区是Windows系统独有的,是用户态锁,事件、信号量和互斥量则是内核态锁。用户态锁在访问时不需要进行用户态与内核态的切换,效率比较高。对于内核态锁,访问时要进行用户态与内核态之间的切换,相对于用户态锁,访问效率要低一些。我们的业务代码运行在用户态,当调用系统API访问内核态锁时,API函数底层需要从用户态切换到内核态,访问完后,再从内核态返回到用户态,这就是用户态与内核态之间的切换。

       出于访问锁的效率问题,一般在Windows平台会优先使用临界区锁。在很多支持跨平台的开源代码中,封装的锁在Windows平台上都被定义成临界区锁。

7、最后

        所以本案例中应该是3个线程之间发生了死锁。因为当前发生死锁的多个线程属于底层的音视频编解码模块,所以这个问题的后续排查只能交给该模块的开发团队了,我这边的排查工作就基本完成了。

资源下载链接为: https://pan.quark.cn/s/1bfadf00ae14 “STC单片机电压测”是一个以STC系列单片机为基础的电压检测应用案例,它涵盖了硬件电路设计、软件编程以及数据处理等核心知识点。STC单片机凭借其低功耗、高性价比和丰富的I/O接口,在电子工程领域得到了广泛应用。 STC是Specialized Technology Corporation的缩写,该公司的单片机基于8051内核,具备内部振荡器、高速运算能力、ISP(在系统编程)和IAP(在应用编程)功能,非常适合用于各种嵌入式控制系统。 在源代码方面,“浅雪”风格的代码通常简洁易懂,非常适合初学者学习。其中,“main.c”文件是程序的入口,包含了电压测的核心逻辑;“STARTUP.A51”是启动代码,负责初始化单片机的硬件环境;“电压测_uvopt.bak”和“电压测_uvproj.bak”可能是Keil编译器的配置文件备份,用于设置编译选项和项目配置。 对于3S锂电池电压测,3S锂电池由三节锂离子电池串联而成,标称电压为11.1V。测时需要考虑电池的串联特性,通过分压电路将高电压转换为单片机可接受的范围,并实时监控,防止过充或过放,以确保电池的安全和寿命。 在电压测电路设计中,“电压测.lnp”文件可能包含电路布局信息,而“.hex”文件是编译后的机器码,用于烧录到单片机中。电路中通常会使用ADC(模拟数字转换器)将模拟电压信号转换为数字信号供单片机处理。 在软件编程方面,“StringData.h”文件可能包含程序中使用的字符串常和数据结构定义。处理电压数据时,可能涉及浮点数运算,需要了解STC单片机对浮点数的支持情况,以及如何高效地存储和显示电压值。 用户界面方面,“电压测.uvgui.kidd”可能是用户界面的配置文件,用于显示测结果。在嵌入式系统中,用
资源下载链接为: https://pan.quark.cn/s/abbae039bf2a 在 Android 开发中,Fragment 是界面的一个模块化组件,可用于在 Activity 中灵活地添加、删除或替换。将 ListView 集成到 Fragment 中,能够实现数据的动态加载列表形式展示,对于构建复杂且交互丰富的界面非常有帮助。本文将详细介绍如何在 Fragment 中使用 ListView。 首先,需要在 Fragment 的布局文件中添加 ListView 的 XML 定义。一个基本的 ListView 元素代码如下: 接着,创建适配器来填充 ListView 的数据。通常会使用 BaseAdapter 的子类,如 ArrayAdapter 或自定义适配器。例如,创建一个简单的 MyListAdapter,继承自 ArrayAdapter,并在构造函数中传入数据集: 在 Fragment 的 onCreateView 或 onActivityCreated 方法中,实例化 ListView 和适配器,并将适配器设置到 ListView 上: 为了提升用户体验,可以为 ListView 设置点击事件监听器: 性能优化也是关键。设置 ListView 的 android:cacheColorHint 属性可提升滚动流畅度。在 getView 方法中复用 convertView,可减少视图创建,提升性能。对于复杂需求,如异步加载数据,可使用 LoaderManager 和 CursorLoader,这能更好地管理数据加载,避免内存泄漏,支持数据变更时自动刷新。 总结来说,Fragment 中的 ListView 使用涉及布局设计、适配器创建定制、数据绑定及事件监听。掌握这些步骤,可构建功能强大的应用。实际开发中,还需优化 ListView 性能,确保应用流畅运
资源下载链接为: https://pan.quark.cn/s/f989b9092fc5 牛顿迭代法是一种高效的数值方法,用于求解方程的根,尤其擅长处理一元高次方程。它基于切线逼近原理,通过迭代逐步逼近方程的实根。对于一元三次方程 ax 3 +bx 2 +cx+d=0(其中 a 6 =0),牛顿迭代法可以找到所有可能的实根,而不仅仅是其中一个。三次方程最多有三个实根或复根的组合。 牛顿迭代法的步骤如下: 初始化:选择一个初始值 x 0 ,尽使其接近实际根。初始值的选择对收敛速度影响很大。 构造迭代公式:迭代公式为 x n+1 =x n − f ′ (x n ) f(x n ) ,其中 f(x) 是方程,f ′ (x) 是其导数。对于一元三次方程,f(x)=ax 3 +bx 2 +cx+d,其导数 f ′ (x)=3ax 2 +2bx+c。 迭代计算:从 x 0 开始,利用迭代公式计算 x 1 ,x 2 ,…,直到满足终止条件,如连续两次迭代的差值小于阈值 ϵ,或达到最大迭代次数。 检查根:每次迭代得到的 x n 可能是根。若 ∣f(x n )∣<ϵ,则认为 x n 是近似根。 在求解一元三次方程时,牛顿迭代法可能会遇到多重根或复根。对于多重根,迭代可能收敛缓慢甚至不收敛,需要特别处理。对于复根,牛顿迭代法可能无法直接找到,因为复数的导数涉及复数除法,通常需要使用牛顿-拉弗森迭代的复数扩展版本。 为了避免陷入局部极值,可以尝试多个不同的初始值进行迭代,从而找到所有实根。牛顿迭代法的收敛性依赖于函数的连续性和二阶导数的存在性,因此在使用前需要满足这些条件。在编程实现时,需考虑数值稳定性以及异常情况的处理,例如分母为零、迭代不收敛等。牛顿迭代法在求解一元三次方程的实根时,表现出了优于其他简单方法的优势。
评论 21
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

dvlinker

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值