9.2.3 NetlinkManager模块分析

最后更新于:2022-04-02 05:53:17

在Vold代码中,使用NM模块的流程是: - 调用Instance创建一个NM对象。 - 调用setBroadcaster设置CL对象。 - 调用start启动NM。 接下来,按这三个步骤来分析NM模块。 1. 创建NM Vold调用Instance函数创建了一个NM对象。看到Instance这个函数,读者应能想到,这里可能是采用了单例模式。来看是否如此,代码如下所示。 **NetlinkManager.cpp** ~~~ NetlinkManager *NetlinkManager::Instance() { if(!sInstance) sInstance = new NetlinkManager();//果然是单例模式 returnsInstance; } ~~~ NM的创建真是非常简单。再看第二个被调用的函数setBroadcaster。 2. setBroadcaster的分析 setBroadcaster就更简单了,它的实现在NetlinkManger类的声明中,如下所示: **NetlinkManager.h** ~~~ void setBroadcaster(SocketListener *sl) {mBroadcaster = sl; } ~~~ setBroadcaster参数中的那个sl其实际类型为CommandListener。需要说明的是,虽然NM设置了CL对象,但Vold的NM并没有通过CL发送消息和接收命令,所以在图9-1中,NM模块和CL模块并没有连接线,这一点务请注意。 下面看最后一个函数start。 3. start的分析 前面说过,NM模块将使用Netlink和Kernel进行IPC通信,那么它是怎么做到的呢?来看代码,如下所示: **NetlinkManager.cpp** ~~~ int NetlinkManager::start() { //PF_NETLINK使用的socket地址结构是sockaddr_nl,而不是一般的sockaddr_in structsockaddr_nl nladdr; int sz= 64 * 1024; memset(&nladdr, 0, sizeof(nladdr)); nladdr.nl_family = AF_NETLINK; nladdr.nl_pid = getpid(); //设置自己的进程pid nladdr.nl_groups = 0xffffffff; /* 创建PF_NETLINK地址簇的socket,目前只支持SOCK_DGRAM类型,第三个参数 NETLINK_KOBJECT_UEVENT表示要接收内核的Uevent事件。 */ if((mSock = socket(PF_NETLINK, SOCK_DGRAM,NETLINK_KOBJECT_UEVENT)) < 0) { ...... return -1; } //设置Socket接收缓冲区大小 if(setsockopt(mSock, SOL_SOCKET, SO_RCVBUFFORCE, &sz, sizeof(sz)) < 0) { ...... return -1; } //必须对该socket执行bind操作 if(bind(mSock, (struct sockaddr *) &nladdr, sizeof(nladdr)) < 0) { ...... return -1; } //创建一个NetlinkHandler对象,并把创建好的Socket句柄传给它。 mHandler = new NetlinkHandler(mSock); //调用NetlinkHandler对象的start if(mHandler->start()) { SLOGE("Unable to start NetlinkHandler: %s", strerror(errno)); return -1; } return0; } ~~~ 从代码上看,NM的start函数分为两个步骤: - 创建地址簇为PF_NETLINK类型的socket并做一些设置,这样NM就能和Kernel通信了。关于Netlink的使用技巧网上有很多资料,读者可在Linux系统上通过man netlink命令来查询相关信息。 - 创建NetlinkHandler对象,并调用它的start。看来,后续工作都是由NetlinkHandler来完成的。 据上文分析可看出,NetlinkHandler才是真正的主角,下面就来分析它。为书写方便起见,NetlinkHandler简称为NLH。 4. NetlinkHandler的分析 (1)创建NLH 代码结构简单的Vold程序中,NetlinkHandler却有一个相对不简单的派生关系,如图9-2所示: :-: ![](http://img.blog.csdn.net/20150802164431558?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center) 图9-2 NLH的派生关系图 直接看代码,来认识这个NLH: **NetlinkHandler.cpp** ~~~ NetlinkHandler::NetlinkHandler(int listenerSocket): NetlinkListener(listenerSocket) { //调用基类NetlinkListener的构造函数。注意传入的参数是和Kernel通信的socket //句柄。注意,文件描述符和句柄表示的是同一个东西,这里不再区分二者。 } ~~~ 再看基类NetlinkListener的构造函数: **NetlinkListener.cpp** ~~~ NetlinkListener::NetlinkListener(int socket) : SocketListener(socket, false) { //调用基类SocketListener的构造函数,第二个参数为false。 } ~~~ 基类SocketListener的构造函数是: **SocketListener.cpp** ~~~ SocketListener::SocketListener(int socketFd,bool listen) { mListen = listen; //这个参数是false mSocketName = NULL; mSock = socketFd;//保存和Kernel通信的socket描述符 //初始化一个mutex,看来会有多个线程存在 pthread_mutex_init(&mClientsLock, NULL); /* SocketClientCollection的声明如下,它是一个列表容器。 typedef android::ListSocketClientCollection 其中,SocketClient代表和Socket服务端通信的客户端。 */ mClients = new SocketClientCollection(); } ~~~ NLH的创建分析完了。此过程中没有什么新鲜内容。下面看它的start函数。 本章内容会大量涉及Socket,所以读者应先了解与Socket有关的知识,如果需要深入研究,建议阅读《Unix NetworkingProgramming Volume I》[^write]一书。 (2)start的分析 在分析前面的代码时,曾看到NetlinkHandler会创建一个同步互斥对象,这表明NLH会在多线程环境中使用,那么这个线程会在哪里创建呢?来看start的代码,如下所示: **NetlinkHandler.cpp** ~~~ int NetlinkHandler::start() { returnthis->startListener();//startListener由SocketListener实现。 } ~~~ **SocketListener.cpp** ~~~ int SocketListener::startListener() { if(!mSocketName && mSock == -1) { errno = EINVAL; return -1; } elseif (mSocketName) { if((mSock = android_get_control_socket(mSocketName)) < 0) { return -1; } } /* 还记得构造NLH时的参数嘛?mListen为false,这表明NLH不是监听端(listen)。 这里为了代码和操作的统一,用mSock做参数构造了一个SocketClient对象, 并加入到mClients列表中,但这个SocketClient并不是真实客户端的代表。 */ if(mListen && listen(mSock, 4) < 0) { ...... return -1; } else if (!mListen)//以mSock为参数构造SocketClient对象,并加入到对应列表中 mClients->push_back(new SocketClient(mSock)); /* pipe系统调用将创建一个匿名管道,mCtrlPipe是一个int类型的二元数组。 其中mCtrlPipe[0]用于从管道读数据,mCtrlPipe[1]用于往管道写数据 */ if(pipe(mCtrlPipe)) { ...... return -1; } //创建一个工作线程,线程函数是threadStart。 if(pthread_create(&mThread, NULL, SocketListener::threadStart, this)) { ...... return -1; } return0; } ~~~ 如果熟悉Socket编程,理解上面的代码就非常容易了。下面来看NLH的工作线程。 (3)工作线程的分析 工作线程的线程函数threadStart的代码如下所示: **SocketListener.cpp** ~~~ void *SocketListener::threadStart(void *obj) { SocketListener *me = reinterpret_cast(obj); me->runListener();//调用runListener。 pthread_exit(NULL); returnNULL; } //直接分析runListener void SocketListener::runListener() { while(1) { SocketClientCollection::iterator it; fd_set read_fds; int rc = 0; int max = 0; FD_ZERO(&read_fds); if(mListen) {//mListen为false,所以不走这个if分支 max = mSock; FD_SET(mSock, &read_fds); } /* 计算max,为什么要有这个操作?这是由select函数决定的,它的第一个参数的取值 必须为它所监视的文件描述符集合中最大的文件描述符加1。 */ FD_SET(mCtrlPipe[0], &read_fds); if(mCtrlPipe[0] > max) max = mCtrlPipe[0]; //还是计算fd值最大的那个 pthread_mutex_lock(&mClientsLock); for (it = mClients->begin(); it != mClients->end(); ++it) { FD_SET((*it)->getSocket(), &read_fds); if ((*it)->getSocket() > max) max = (*it)->getSocket(); } pthread_mutex_unlock(&mClientsLock); /* 注意select函数的第一个参数,为max+1。读者可以通过man select来查询 select的用法,注意,在Windows平台上的select对第一个参数没有要求。 */ if((rc = select(max + 1, &read_fds, NULL, NULL, NULL)) < 0) { sleep(1); continue; }else if (!rc) continue; //如果管道可读的话,表示需要退出工作线程。 if(FD_ISSET(mCtrlPipe[0], &read_fds)) break; if(mListen && FD_ISSET(mSock, &read_fds)) { //如果是listen端的话,mSock可读表示有客户端connect上 struct sockaddr addr; socklen_t alen = sizeof(addr); int c; //调用accept接受客户端的连接,返回用于和客户端通信的Socket描述符 if ((c = accept(mSock, &addr, &alen)) < 0) { SLOGE("accept failed (%s)", strerror(errno)); sleep(1); continue; } pthread_mutex_lock(&mClientsLock); //根据返回的客户端Socket描述符构造一个SocketClient对象,并加入到对应list mClients->push_back(new SocketClient(c)); pthread_mutex_unlock(&mClientsLock); } do{ pthread_mutex_lock(&mClientsLock); for (it = mClients->begin(); it !=mClients->end(); ++it) { int fd = (*it)->getSocket(); if (FD_ISSET(fd, &read_fds)) { pthread_mutex_unlock(&mClientsLock); /* 有数据通过Socket发送过来,所以调用onDataAvailable进行处理。 如果在onDataAvailable返回false,表示需要关闭该连接。 */ if (!onDataAvailable(*it)){ close(fd); pthread_mutex_lock(&mClientsLock); delete *it; it =mClients->erase(it); pthread_mutex_unlock(&mClientsLock); } FD_CLR(fd, &read_fds); continue; } } pthread_mutex_unlock(&mClientsLock); }while (0); } } ~~~ 从代码中可看到: - 工作线程退出的条件是匿名管道可读,但在一般情况下不需要它退出,所以可以忽略此项内容。 - 不论是服务端还是客户端,收到数据后都会调用onDataAvailable进行处理。 下面就来看NLH的数据处理。 (4)数据处理 根据前面的分析,收到数据后首先调用onDataAvailable函数进行处理,这个函数由NLH的基类NetlinkListener实现。代码如下所示: **NetlinkListener** ~~~ bool NetlinkListener::onDataAvailable(SocketClient*cli) { intsocket = cli->getSocket(); intcount; /* 调用recev接收数据,如果接收错误,则返回false,这样这个socket在 上面的工作线程中就会被close。 */ if((count = recv(socket, mBuffer, sizeof(mBuffer), 0)) < 0) { SLOGE("recv failed (%s)", strerror(errno)); return false; } //new一个NetlinkEvent,并调用decode来解析接收到的Uevent数据 NetlinkEvent *evt = new NetlinkEvent(); if(!evt->decode(mBuffer, count)) { goto out; } //调用onEvent,并传递NetlinkEvent对象。 onEvent(evt); out: deleteevt; return true; ~~~ decode函数就是将收到的Uevent信息填充到一个NetlinkEvent对象中,例如Action是什么,SUBSYSTEM是什么等,以后处理Uevent时就不用再解析字符串了。 看onEvent函数,此函数是由NLH自己实现的,代码如下所示: **NetlinkHandler.cpp** ~~~ void NetlinkHandler::onEvent(NetlinkEvent *evt){ VolumeManager *vm = VolumeManager::Instance(); constchar *subsys = evt->getSubsystem(); if(!subsys) { return; } if (!strcmp(subsys, "block")) { vm->handleBlockEvent(evt); //调用VM的handleBlockEvent } elseif (!strcmp(subsys, "switch")) { vm->handleSwitchEvent(evt);//调用VM的handleSwitchEvent } else if (!strcmp(subsys, "battery")){ //这两个事件和外部存储系统没有关系,所以不处理 } elseif (!strcmp(subsys, "power_supply")) { } } ~~~ NLH的工作已介绍完,下面总结一下NM模块的工作。 5. NM模块的总结 NM模块的功能就是从Kernel接收Uevent消息,然后转换成一个NetlinkEvent对象,最后会调用VM的处理函数来处理这个NetlinkEvent对象。 [^write]: 该书中文版名为《UNIX网络编程第3版.第1卷,套接字联网API》,人民邮电出版社,2009年版。
';