(1)线程基础
最后更新于:2022-04-01 21:44:42
在Windows系统中,进程更像一个容器,其功能的实现是靠线程完成的,即进程具有惰性。一个进程,至少拥有一个线程来执行任务。(进程第一个被创建的线程叫做主线程,其他的进程中的线程均为其子线程)
## 线程数据结构
对进程来说,一个进程包括 一个地址空间 和 一个内核对象。
对于线程,类似的 拥有一个内核对象 和 一个线程栈(用于维护线程执行时 所需要的函数参数及变量)。
同时,对于线程来说,他们还有一个进程层面的存储空间TLS(线程本地存储),这部分存储空间用于存储线程的私有全局变量用于支持非线程安全的C/C++函数。
## 进程与线程的资源开销
进程拥有独立的地址空间,线程在进程内共享进程空间,因此线程间可以直接处理相同的数据及共享句柄对象(句柄表是属于进程的,可有线程共享)。
操作系统对进程切换的处理需要有大量的记录(虚拟空间的切换),以及exe和dll加载入地址空间的消耗,因此进程的切换远大于线程。
线程切换仅仅是线程上下文的切换(即运行时寄存器的少量记录与转换)。
## 线程的创建
线程的创建需要 一个线程函数(用于线程执行任务) 及 线程创建线程的函数。
Windows中线程函数原型如下
~~~
DWORD WINAPI ThreadFunc(PVOID pvParam)
{
....
return 0;
}
~~~
对应的创建Windows线程的函数为
~~~
HANDLE WINAPI CreateThread(
_In_opt_ LPSECURITY_ATTRIBUTES lpThreadAttributes,
_In_ SIZE_T dwStackSize,
_In_ LPTHREAD_START_ROUTINE lpStartAddress,
_In_opt_ LPVOID lpParameter,
_In_ DWORD dwCreationFlags,
_Out_opt_ LPDWORD lpThreadId
);
~~~
但是在实际中,如果我们是编写的C/C++代码,那么我们不要使用这个函数,因为其并不完整的支持非线程安全的C/C++函数(可能会导致内存泄露)。这里,应该使用Microsoft C
/C++编译器提供的_beginthreadex函数(或使用C++ 11标准中的thread类)
这里需要记住的是,一个线程调用CreateThread函数后,其返会的线程内核对象句柄(Handle)的引用计数是2,(创建该线程1的线程一个,线程自己一个,线程自己的会在线程函数执行完毕后自动close其句柄)。而内核对象销毁的必要条件是句柄引用为0。为了防止资源泄露,在创建了线程后主动掉一下CloseHandle是一个不错的习惯。比如
~~~
DOWD WINAPI ThreadFunc(PVOID pvParam)
{
....
return 0; // will close thread handle automatly
}
...
HANDLE hThread = CreateThread(.., ThreadFunc, ...);
CloseHandle(hThread); // Good!
~~~
## Windows线程的创建过程
当用户调用函数创建线程后,windows系统会做两件事:
1、创建一个代表新线程的内核对象。
2、在当前进程空间中分配内存空间给新线程的线程栈。
这里还要强调下,因为新线程是与其他线程在同一个进程地址空间中运行,因此新线程可以直接访问进程的所有句柄,内存空间以及其他线程的线程栈。因此同一进程的线程通信非常简单,但要注意线程间同步的问题。
## CreateThread函数参数意义
psa
线程安全属性
*dwStackSize*
默认线程栈的大小(以字节为单位)。线程栈的大小同时可以在编译器的/STACK指定,默认为1M。线程栈会取其中较大的一个值。限制线程栈的大小可以检测到无穷递归的bug。
*lpStartAddress*和*lpParameter*
分别指向线程函数地址与线程参数地址。
*dwCreationFlags*
线程创建后执行标志。
若为0,则线程立即执行。
若为**CREATE_SUSPENDED**,则线程创建后不会立即执行,而是等待[**ResumeThread**](https://msdn.microsoft.com/en-us/library/ms685086%28v=vs.85%29.aspx)函数手动执行。
**STACK_SIZE_PARAM_IS_A_RESERVATION**若设置该flag,则线程栈空间只会预定而不会实际分配。若没有设置,则默认直接分配线程栈空间。
*lpThreadId* 传出函数,获取新建线程的id。传入null则不关心该thread id。
## 终止线程的运行
如果我们编写的是C++的windows程序,那么,在线程终止时,我们应该期待如下四点的清理工作能够执行:
1、属于该线程栈上的所有C++对象的析构函数得以调用。(C++要求)
2、该线程的线程栈使用的内存能够正确的释放。(windows要求)
3、线程内核对象引用计数减一(注意这里是减一而不是销毁。线程内核对象生命可能会长于线程函数本身)。(windows要求)
4、操作系统将线程退出代码作为线程函数的返回值。(windows要求)
基于上述4点要求,依次比较线程结束的四种方法。
### 线程函数结束
这是唯一能够完全执行线程清理方法的结束方式。
### ExitThread函数
由被终止线程自身调用,可传入线程返回代码作为线程返回值。该函数属于windows系统API,因此只会执行2——3的windows清理工作,而C++对象不会析构。
(注意:若使用的是C/C++代码,必须得调用ExitThread函数时,应该使用_endthreadex函数代替,原因见后面)
### TerminateThread函数
该函数可以杀死任意线程(取决于传入该函数的线程句柄)。应该知道:
该函数是异步的。
由于该函数的突然性,被杀死的线程资源不会得到清理(但内核对象计数会减一)。
数据不会写回磁盘。
C++对象不会析构(由于是windows API函数)。
在dll的main函数中不会得到被TerminateThread函数杀死线程的退出通知。
### 包含线程的进程退出
这种情况下,类似于对每个进程内线程调用TerminateThread函数,但操作系统会保证进程的资源全部释放(即内核对象、线程栈资源都会释放 )。但C++对象不会得到析构,同时数据不会写回到磁盘……
因此,在进程返回前,我们通常会调用join或wait函数等待其内线程函数的结束。
这里要注意的是dll main函数中多线程死锁的问题,详细可见:
http://blog.csdn.net/guke1978_123/article/details/625773
## 线程结束后
现在讨论线程结束后,操作系统肯定会执行的操作。
1、线程所拥有的用户对象句柄被释放(窗口和挂钩)
2、线程退出代码由STILL_ACTIVE变为Exitthread或TerminateThread的传入值。
3、线程内核对象变为触发状态。
4、线程内核对象计数减一。
5、若该线程为进程最后的活动线程,则进程终止。
注意,当线程结束时,其内核对象并不会立即销毁,只有当说有拥有该线程内核对象的线程关闭其句柄时,句柄对象才会真正销毁。因此,在线程结束时,其他线程仍可以调用
GetExitCodeThread函数获取线程的退出代码。
';