openVswitch(OVS)源代码分析 upcall调用(之linux中的NetLink通信机制)
最后更新于:2022-04-01 07:42:40
前面做了一大堆的准备就是为了分析下upcall调用,但是现在因为工作重心已经从OpenVswitch上转移到了openstack,所以根本没时间去研究OpenVswitch了。(openstack是用Python写的,我大学没接触过Python,所以现在要一边学Python一边学openstack)后面的OpenVswitch分析更新的时间可能会有点久。
由于前面做了很多准备,所以这里不能只分析NetLink通信机制(否则可能会感觉没意思了),首先来分析下upcall函数调用的原因。如果看了前面的源码分析的就会知道,在什么情况下会调用upcall函数呢?就是在一个数据包查找不到相应的流表项时,才会调用upcall函数(比如一个数据包第一次进入这个内核,里面没有为这个数据包设定相应的流表规则)。upcall函数的调用其实就是把数据包的信息下发到用户 空间去,而由内核空间到用户空间的通信则要用到linux中的NetLink机制。所以熟悉下NetLink通信可以知道upcall函数调用需要什么样的参数以及整个函数的作用和功能。
现在来测试下NetLink的使用,NetLink由两部分程序构成,一部分是用户空间的,另外一部分是内核空间的。用户空间的和大多数socket编程一样,只是用的协议时AF_NETLINK,其他基本都市一样的步骤。
下面是NetLine程序中的用户代码NetLinke_user.c:
~~~
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include <sys/types.h>
#include<unistd.h>
#include<sys/stat.h>
#include<sys/socket.h>
#include<linux/netlink.h>
#define NETLINK_TEST 30
#define MAX_MSG 1024
int main(void)
{
/*按代码规范所有变量都要定义在函数的开始部分,但为了便于理解,所以顺序定义变量*/
/*
* struct sockaddr_nl addr;
* struct nlmsghdr *nlhdr;
* struct iovec iov;
* struct msghdr msg;
* int sockId;
*/
//创建socket套接字
int socketId = socket(AF_NETLINK,SOCK_RAW,NETLINK_TEST);
if (0 > socketId){
printf("The error in socket_create!\n");
return -1;
}
//套接字地址设置
struct sockaddr_nl addr;
memset(&addr,0,sizeof(struct sockaddr_nl));
addr.nl_family = AF_NETLINK; //一定是这个协议
addr.nl_pid = 0; //消息是发给内核的,所以为0;或者内核多播数据给用户空间
addr.nl_groups = 0; // 单播或者发给内核
//将打开的套接字和addr绑定
int ret = bind(socketId,(struct sockaddr*)(&addr),sizeof(addr));
if (0 > ret){
printf("The error in bind!\n");
close(socketId);
return -1;
}
//NetLink消息头设置
struct nlmsghdr *nlhdr = NULL;
nlhdr = (struct nlmsghdr*)malloc(NLMSG_SPACE(MAX_MSG));
if (!nlhdr){
printf("The error in nlmsghdr_malloc!\n");
close(socketId);
return -1;
}
nlhdr->nlmsg_len = NLMSG_SPACE(MAX_MSG);
nlhdr->nlmsg_pid = getpid();//内核如果要返回消息会查找这个pid
nlhdr->nlmsg_flags = 0;
strcpy(NLMSG_DATA(nlhdr),"This is data what will be sent!\n");
//设置消息缓存指针
struct iovec iov;
memset(&iov,0,sizeof(struct iovec));
iov.iov_base = (void*)nlhdr;
iov.iov_len = NLMSG_SPACE(MAX_MSG);
//设置消息结构体
struct msghdr msg;
memset(&msg,0,sizeof(struct msghdr));
msg.msg_iov = &iov;
msg.msg_iovlen = 1;
//发送消息给内核
ret = sendmsg(socketId,&msg,0);
if (0 > ret){
printf("The error in sendmsg!\n");
close(socketId);
free(nlhdr);
return -1;
}
/**********接受消息部分***********/
printf("begin receive message!\n");
//对接受消息的字段进行清零,因为发送时,里面存储了发送数据
memset((char*)NLMSG_DATA(nlhdr),0,MAX_MSG);
recvmsg(socketId,&msg,0);
//打印接受到的消息
printf("receive message:===========\n%s\n",NLMSG_DATA(nlhdr));
//收尾工作,对资源的处理
close(socketId);
free(nlhdr);
return 0;
}
~~~
NetLink程序内核代码本来有两种情况的:一、单播给某个指定的pid;二、多播个nl_gloups.下面的代码只有单播的功能,没有多播。多播实验了很久也没成功,所以就搁着了。
下面是NetLink程序中的NetLink_kernel.c内核代码:
~~~
/*=======================KERNEL==========================================*/
#include<linux/init.h>
#include<linux/module.h>
#include<linux/kernel.h>
#include<linux/types.h>
#include<net/sock.h>
#include <linux/skbuff.h>
#include <linux/ip.h>
#include <linux/sched.h>
#include<linux/netlink.h>
#define NETLINK_TEST 30
#define MAX_MSG 1024
// 内核sock
struct sock* socketId = NULL;
// 单播数据
char kernel_to_user_msg_unicast[] = "hello userspace uncast!";
int unicastMsgLen = NLMSG_SPACE(sizeof(kernel_to_user_msg_unicast));
// 单播,groups一定要为0,pid则为单播pid
int kernel_unicast_user(u32 pid)
{
struct sk_buff *skb_sent = NULL;
struct nlmsghdr *nlhdr = NULL;
// 创建网络数据包结构体
skb_sent = alloc_skb(unicastMsgLen,GFP_KERNEL);
if (!skb_sent){
printk(KERN_ALERT"error in uncast alloc_skb!\n");
return -1;
}
// nlhdr = NLMSG_NEW(skb_sent,0,0,NLMSG_DONE,unicastMsgLen,0);
nlhdr = nlmsg_put(skb_sent, 0, 0, 0, unicastMsgLen,0);
// 填充发送数据
memcpy(NLMSG_DATA(nlhdr),kernel_to_user_msg_unicast,unicastMsgLen);
// 设置控制块
NETLINK_CB(skb_sent).pid = 0;
NETLINK_CB(skb_sent).dst_group = 0;
// 单播发送
if (0 > netlink_unicast(socketId,skb_sent,pid,0)){
printk(KERN_ALERT"error in netlink_unicast\n");
return -1;
}
return 0;
}
EXPORT_SYMBOL(kernel_unicast_user);// 导出函数符号
// 注册的回调函数,处理接受到数据
static void kernel_recv_user(struct sk_buff *__skb)
{
struct sk_buff *skb = NULL;
struct nlmsghdr *nlhdr = NULL;
skb = skb_get(__skb);// 从一个缓冲区中引用指针出来
if (skb->len >= NLMSG_SPACE(0)){ //其实就是判断是否为空
nlhdr = nlmsg_hdr(skb);// 宏nlmsg_hdr(skb)的实现为(struct nlmsghdr*)skb->data
// 开始打印接受到的消息
printk(KERN_INFO"base info =======\n len:%d, type:%d, flags:%d, pid:%d\n",
nlhdr->nlmsg_len,nlhdr->nlmsg_type,nlhdr->nlmsg_flags,nlhdr->nlmsg_pid);
printk(KERN_INFO"data info =======\n data:%s\n",(char*)NLMSG_DATA(nlhdr));
}
kernel_unicast_user(nlhdr->nlmsg_pid);
}
// 模块插入时触发的函数,一般用来做初始化用,也是模块程序的入口
static int __init netlink_init(void)
{
printk(KERN_ALERT"netlink_init()!\n");
socketId = netlink_kernel_create(&init_net,NETLINK_TEST,0,kernel_recv_user,NULL,THIS_MODULE);
if (!socketId){
printk(KERN_ALERT"error in sock create!\n");
return -1;
}
return 0;
}
// 模块退出时触发的函数,目的一般是用来清理和收尾工作
static void __exit netlink_exit(void)
{
printk(KERN_ALERT"netlink_exit()!\n");
netlink_kernel_release(socketId);
}
MODULE_LICENSE("Dual BSD/GPL");
MODULE_AUTHOR("yuzhihui");
module_init(netlink_init);
module_exit(netlink_exit);
~~~
上面的两个程序就是linux中内核空间和用户空间通信的实例,其实这个NetLink通信实验并不是非常重要,对理解OpenVswitch来说,个人只是兴趣所好,特意去看了下NetLink的工作原理。至于多播的功能实现,如果有知道麻烦给个链接。
由于时间问题,做这个实验和写这个blog相差了一个多月,很多当时注意到问题,或者想分享的细节都已经记不清了。所以感觉比较简陋,当然也必不可少有些不正确之处,希望发现的可以指正,谢谢!!
转载请注明作者和原文出处,原文地址:[http://blog.csdn.net/yuzhihui_no1?viewmode=list](http://blog.csdn.net/yuzhihui_no1?viewmode=list)