libevent源码学习(7):event_io_map——哈希表数据结构解析

目录

event_io_map

哈希表操作函数

hashcode与equals函数

哈希表初始化

哈希表元素查找

哈希表扩容

哈希表元素插入

哈希表元素替换

哈希表元素删除

自定义条件删除元素

哈希表第一个非空元素

哈希表下一个元素

释放哈希表

向event_io_map中添加event

激活event_io_map中的event

删除event_io_map中的event


以下源码均基于libevent-2.0.21-stable。

       在libevent中,自定义了一个哈希表结构用于实现event_io_map,该哈希表相关代码在ht-internal.h中,从该头文件的名称也可以看出来,libevent中的哈希表是一个并不对用户开放的内部使用结构。哈希表用于实现event_io_map,因此先来看看event_io_map的定义。

event_io_map

       在event_internal.h文件中,有如下定义:

#ifdef WIN32
/* If we're on win32, then file descriptors are not nice low densely packed
   integers.  Instead, they are pointer-like windows handles, and we want to
   use a hashtable instead of an array to map fds to events.
*/
#define EVMAP_USE_HT
#endif

/* #define HT_CACHE_HASH_VALS */

#ifdef EVMAP_USE_HT    //在windows下就是用哈希结构,否则直接使用event_signal_map
#include "ht-internal.h"
struct event_map_entry;
HT_HEAD(event_io_map, event_map_entry);  //定义一个结构体名为event_io_map,其中的哈希表元素类型为event_map_entry
#else
#define event_io_map event_signal_map
#endif

        根据上述定义可知,仅在Windows环境下,event_io_map会使用哈希结构,否则event_io_map直接按event_signal_map使用。

       这里涉及到了一个宏定义HT_HEAD以及一个结构体event_map_entry,先来看看event_map_entry结构体的定义。

#ifdef EVMAP_USE_HT
struct event_map_entry {
	HT_ENTRY(event_map_entry) map_node;  //构成哈希表中同一个桶下的链表
	evutil_socket_t fd;    //文件描述符
	union { /* This is a union in case we need to make more things that can
			   be in the hashtable. */
		struct evmap_io evmap_io;    //存放同一个文件描述符/信号值下的所有event
	} ent;
};

       可以看到,在event_map_entry这一结构体中,还涉及到了一个HT_ENTRY宏定义,除此之外,其中包含了一个文件描述符/信号值成员fd,以及一个联合体中定义了一个evmap_io类型的结构体。对于这里的HT_ENTRY以及前面的HT_HEAD,各自的宏定义如下所示:

#define HT_HEAD(name, type)                                             \
  struct name {                                                         \
    /* The hash table itself. */                                        \
    struct type **hth_table;  /* 哈希表 可以当做数组 hth_table[i]就是该数组中第i个struct type * 类型元素*/                                          \
    /* How long is the hash table? */                                   \
    unsigned hth_table_length; /*哈希表的容量*/                                         \
    /* How many elements does the table contain? */                     \
    unsigned hth_n_entries; /*哈希表中的元素数量*/                                            \
    /* How many elements will we allow in the table before resizing it? */ \
    unsigned hth_load_limit; /*哈希表扩容阈值*/                                           \
    /* Position of hth_table_length in the primes table. */             \
    int hth_prime_idx; /*哈希表长度在素数数组中的索引*/                                  \
  }

#ifdef HT_CACHE_HASH_VALUES
#define HT_ENTRY(type)                          \
  struct {                                      \
    struct type *hte_next;                      \
    unsigned hte_hash;                          \
  }
#else
#define HT_ENTRY(type)                          \
  struct {                                      \
    struct type *hte_next;                      \
  }
#endif

       对于HT_HEAD宏定义,其中包含5个成员,各自的含义可参照注释。需要注意的是第一个成员struct type **hth_table,从成员名来看就是哈希表,这是一个二级指针,在C语言中规定,p[i]等价于*(p+i),换到这里来看,hth_table是一个指向type *类型的指针,因此(p+i)就是从首地址偏移了i个type *类型大小的地址,而*(p+i)自然也就是从首地址算起,第i个type *类型的元素了,因此,hth_table作为一个二级指针,那么hth_table[i]也就是第i个type*类型的元素,hth_table也就相当于一个type *类型的数组了。

       再来看 HT_ENTRY这一宏定义,它定义了一个匿名结构体,该结构体的接个头由宏定义HT_CACHE_HASH_VALUES控制,在libevent中,我目前尚未找到HT_CACHE_HASH_VALUES的定义,也就是说,该宏定义默认为未定义的,可由用户自行选择是否定义。

       接下来,替换以上两个宏定义,再回到event_map_entry和event_io_map中,得到各自定义如下:

struct event_map_entry
{
    struct
    {
        struct event_map_entry *hte_next;   //构成链表
#ifdef HT_CACHE_HASH_VALUES
        unsigned hte_hash;
#endif
    }map_node;
 
    evutil_socket_t fd;
    union
    {
        struct evmap_io evmap_io;
    }ent;
};


struct event_io_map
{
    //哈希表,连续地址分配
    struct event_map_entry **hth_table;
    //哈希表的长度
    unsigned hth_table_length;
    //哈希的元素个数
    unsigned hth_n_entries;
    //哈希表扩容阈值,当哈希表中元素数目达到这个值就需要进行扩容
    unsigned hth_load_limit;
    //哈希表的长度所对应素数数组中的索引
    int hth_prime_idx;
};

       在event_io_map中,二级指针hth_table刚刚说了,可以看做是一个数组,这个数组的各个元素类型为event_map_entry *类型,而在event_map_entry结构体的定义中,一个hte_next很明显表明了这里会存在一个event_map_entry的链表。在来看后面的evmap_io结构体定义,如下所示:

struct evmap_io
{
    struct event_list events;   //event双向链表
    ev_uint16_t nread;    //链表中读事件的个数
    ev_uint16_t nwrite;   //链表中写事件的个数
};

        关于event_list类型,可以在event_struct.h中找到其相关语句:(关于TAILQ)

TAILQ_HEAD (event_list, event);  //名为event_list的头结点,链表结点为event类型

        也就是说,在evmap_io中,定义了一个event的双向链表,以及一个nread变量和nwrite变量,而一个event_map_entry对应一个evmap_io,也就对应一个event的双向链表。

        因此总结得出event_io_map的结构,如下所示:

libevent源码学习(7):event_io_map——哈希表数据结构解析_第1张图片

       这样,我们就大概知道了libevent中哈希表的结构:

       hth_table就是哈希表中的“桶数组”,它的每一个元素都是一个“桶”,这里将哈希表分为主链和冲突链,哈希表主链上的各个结点放置的是地址连续的event_map_entry指针,通过下标如hth_table[i]就可以直接访问第i个结点,它的底层就是*(hth_table+i),这是一个寻址的过程,时间复杂度为O(1)。主链上每一个这样的event_map_entry指针都指向一个event_map_entry实体。如果有多个event_map_entry实体对应同一个桶,这就引起了哈希冲突,从图中也可得知,libevent是采用拉链法来解决哈希冲突的,如图中褐色框中的内容所示。

       每个event_map_entry都对应了一个fd,对于event这是一个文件描述符,对于signal这是一个信号值,也就对应了一个监听事件。如果多个事件对应同一个fd,那么这些事件就会被放到evmap_io所对应的event事件双向链表中,evmap_io中的nread和nwrite则分别记录了这个双向链表中读类型和写类型的event数量

       总之,event_io_map中会保存所有通过event_add添加的io event。

哈希表操作函数

      在ht-internal.h中,哈希表相关的函数主要都是以宏函数来实现的,找到这些函数的宏定义如下所示:

#define HT_EMPTY(head)                          \
  ((head)->hth_n_entries == 0)

/* How many elements in 'head'? */
#define HT_SIZE(head)                           \
  ((head)->hth_n_entries)

#define HT_FIND(name, head, elm)     name##_HT_FIND((head), (elm))
#define HT_INSERT(name, head, elm)   name##_HT_INSERT((head), (elm))
#define HT_REPLACE(name, head, elm)  name##_HT_REPLACE((head), (elm))
#define HT_REMOVE(name, head, elm)   name##_HT_REMOVE((head), (elm))
#define HT_START(name, head)         name##_HT_START(head)
#define HT_NEXT(name, head, elm)     name##_HT_NEXT((head), (elm))
#define HT_NEXT_RMV(name, head, elm) name##_HT_NEXT_RMV((head), (elm))
#define HT_CLEAR(name, head)         name##_HT_CLEAR(head)
#define HT_INIT(name, head)          name##_HT_INIT(head)

       这里只有两个函数直接给出了实现,而其他函数都是宏定义为name##_HT_XXX的宏函数上面,可以发现,这些宏函数对应了三个参数:name、head以及elm。宏定义中的“##”起的是连接作用。从函数名上大概能推断出函数的功能,不过如果直接去看这些宏函数的定义会非常懵的,在event_io_map中,这些宏定义中的name参数直接替换为"event_io_map"即可。

       将这些宏定义全部替换(用gcc -E编译),然后就可以看到event_io_map中的这些函数的实现。

       在分析函数实现之前,有必要先回过头再看一下event_io_map结构体:

struct event_io_map
{
    //哈希表,连续地址分配
    struct event_map_entry **hth_table;
    //哈希表的长度
    unsigned hth_table_length;
    //哈希的元素个数
    unsigned hth_n_entries;
    //哈希表扩容阈值,当哈希表中元素数目达到这个值就需要进行扩容
    unsigned hth_load_limit;
    //哈希表的长度所对应素数数组中的索引
    int hth_prime_idx;
};

        hth_table:哈希表,hth_table[i]就是哈希表中的第i个桶;

        hth_table_length:哈希表的长度。为了让元素散列更加均匀,哈希表的长度最好选为素数,libevent中提供了一个素数数组,哈希表的长度都是以该数组中的元素为准,即使是哈希表扩容,也是一样的,该素数数组定义如下:

static unsigned name##_PRIMES[] = {                                   \
    53, 97, 193, 389,                                                   \
    769, 1543, 3079, 6151,                                              \
    12289, 24593, 49157, 98317,                                         \
    196613, 393241, 786433, 1572869,                                    \
    3145739, 6291469, 12582917, 25165843,                               \
    50331653, 100663319, 201326611, 402653189,                          \
    805306457, 1610612741                                               \
  };  

       可以发现,素数数组中的每个元素都是素数,并且后一个元素近似为前一个元素两倍。而hth_table_length也只能取该数组中的某个值;

       hth_n_entries:哈希表中的元素个数;

       hth_load_limit:哈希表的扩容阈值。扩容阈值的含义是:当哈希表中的元素个数达到这个值后,哈希表就需要进行扩容;

       hth_prime_idx:哈希表的长度对应素数数组中该元素的索引。比如说哈希表的长度为193,那么hth_prime_idx就为2。

hashcode与equals函数

       在java的HashMap中,提供了一个hashcode方法以及equals方法,前者可以将不同类型参数转换为一个int型的散列值,而后再通过哈希算法找到对应的桶位置,而后者则是用于判断哈希表中两个元素是否相等。

       在libevent中,也定义了这两个函数。

       event_io_map中为event_map_entry类型的参数提供了一个取相应hashcode的函数hashsocket,根据英文注释可知,由于windows中socket的低2~3位是没有多大影响的,也就是可能会存在很多socket的低2~3位是相同的情况。如果两个socket只有低2~3位不同,那么说明这两个socket的值是非常接近的,而在哈希表中,对于非常接近的元素也希望把他们尽量的散列开,因此这里并没有直接使用event_map_entry的fd作为hashcode,而是先将fd的二进制位进行旋转,将其低2位放到高2位去,然后再与原来的fd进行求和,这样,即使值相近的两个socket的hashcode也会有很大的差别,更有利于散列。如下所示:(evmap.c)

static inline unsigned
hashsocket(struct event_map_entry *e)
{
	/* On win32, in practice, the low 2-3 bits of a SOCKET seem not to
	 * matter.  Our hashtable implementation really likes low-order bits,
	 * though, so let's do the rotate-and-add trick. */
	unsigned h = (unsigned) e->fd;
	h += (h >> 2) | (h << 30);  // h>>2后只剩前面30位,h<<30后只有最后2位,相当于把最后2位放到了最前面,然后再与原数相加
	return h;
}

       当取得元素相应的hashcode值之后,就需要通过这个hashcode来找到它在哈希表中相应的桶的位置。这里采用的方法是直接让hashcode对哈希表长度取模%,得到的结果就是该元素在哈希表中桶的位置。 如果找到了桶的位置,并且桶是空的,那么直接将该元素放到桶中,如果桶中已经有元素了,说明此时产生了哈希冲突,如前所述,这里解决哈希冲突的方法是将冲突的元素组合成一个链表。举个例子,java中的HashMap或者是C++中的Map,存储的都是一个key-value键值对,当你通过key去寻找对应的value时,就会对value相应的hashcode先通过哈希算法(比如这里是hashcode取哈希表长度的模)求得key对应的桶的位置,然后再在桶中去看是否有元素与传入的元素"equals",如果没有那么就是查找失败,否则就返回equals成功的那个元素。

       libevent中通过eqsocket函数来判断哈希表中的两个元素是否相同,判断的方法很简单,就是看二者的fd是否相等即可。

static inline int
eqsocket(struct event_map_entry *e1, struct event_map_entry *e2)
{
	return e1->fd == e2->fd;
}

哈希表初始化

       event_io_map哈希表初始化函数为event_io_map_HT_INIT,需要注意的是,这里只是让hth_table初始化为NULL,并没有为其分配实际的内存,哈希表此时也并不存在。如下所示:

static inline void event_io_map_HT_INIT(struct event_io_map *head)   //哈希表初始化
{
    head->hth_table_length = 0; 
    head->hth_table = NULL;  
    head->hth_n_entries = 0;
    head->hth_load_limit = 0;
    head->hth_prime_idx = -1;
}

哈希表元素查找

       这里定义了两个哈希表元素查找函数,一个是_event_io_map_HT_FIND_P,一个则是_event_io_map_HT_FIND。二者都是在哈希表中去寻找与传入参数elm的fd相等的元素,不同的是前者返回的是哈希表中fd与elm相同的元素地址的指针,而后者则是返回该元素的地址。

static inline struct event_map_entry **
_event_io_map_HT_FIND_P(struct event_io_map *head,
                        struct event_map_entry *elm)   //返回哈希表中,fd与elm相等的元素地址,如果哈希表不存在就返回NULL,如果哈希表中不存在该元素*p=NULL
{
    struct event_map_entry **p;
    if (!head->hth_table)   //哈希表未分配
        return NULL;
 
#ifdef HT_CACHE_HASH_VALUES
    p = &((head)->hth_table[((elm)->map_node.hte_hash)    //先将传入的elm进行哈希后取模,找到该元素在哈希表中的位置,然后找到哈希表中该位置上的元素,p为该元素地址
            % head->hth_table_length]);
#else
    p = &((head)->hth_table[(hashsocket(*elm))%head->hth_table_length]);
#endif

    while (*p)    //从该位置开始遍历整个冲突链,查找冲突链上是否有与elm的fd相等的元素,如果有就返回该元素地址
    {
        //判断是否相等。在实现上,只是简单地根据fd来判断是否相等
        if (eqsocket(*p, elm))   
            return p;
 
        //p存放的是hte_next成员变量的地址
        p = &(*p)->map_node.hte_next;
    }
 
    return p;   //如果没找到,那么*p = NULL
}

 

static inline struct event_map_entry *
event_io_map_HT_FIND(const struct event_io_map *head,
                     struct event_map_entry *elm)    //返回的是哈希表中该结点元素
{
    struct event_map_entry **p;
    struct event_io_map *h = (struct event_io_map *) head;
 
#ifdef HT_CACHE_HASH_VALUES
    do
    {   //计算哈希值
        (elm)->map_node.hte_hash = hashsocket(elm);
    } while(0);
#endif
 
    p = _event_io_map_HT_FIND_P(h, elm);   //p为NULL说明哈希表未分配,如果已分配,但是没找到,那么*p为NULL
    return p ? *p : NULL;    //返回NULL可能是哈希表本身未分配,也可能是哈希表中没有该元素
}

哈希表扩容

       哈希表中每次扩容都是接近加倍,加倍扩容可以一次取得较大的容量,也就不用经常扩容了。不过对于哈希表扩容来说,它的作用不单单是为了增大空间,它也能降低哈希冲突发生的概率。

       哈希表中通过HT_GENERATE宏设置了扩容因子,默认为0.5,而哈希表的扩容阈值,就是哈希表的长度乘以这个扩容因子得到的值,当哈希表中元素的个数超过扩容阈值,那么就说明需要进行扩容了。实际上扩容因子的设置并不固定,这里之所以将其设置为0.5,是为了降低哈希冲突概率的同时也避免频繁的扩容。

        event_io_map的扩容函数为event_io_map_HT_GROW,其定义如下:

int event_io_map_HT_GROW(struct event_io_map *head, unsigned size) //哈希表扩容
{
    unsigned new_len, new_load_limit;
    int prime_idx;
 
    struct event_map_entry **new_table;
	//哈希表当前长度对应素数表中最后一个元素,此时不能再扩容了
    if (head->hth_prime_idx == (int)event_io_map_N_PRIMES - 1)  
        return 0;
 
    //还未达到哈希表扩充阈值,无需扩容
    if (head->hth_load_limit > size)
        return 0;
	//执行到这里说明哈希表需要进行扩容了,下面开始扩容
    prime_idx = head->hth_prime_idx; //保存当前哈希表长度对应的素数数组索引
 
    do {
        new_len = event_io_map_PRIMES[++prime_idx];    //从素数数组中得到扩容后的长度
 
        new_load_limit = (unsigned)(0.5*new_len);   //更新扩容阈值
    } while (new_load_limit <= size
             && prime_idx < (int)event_io_map_N_PRIMES);  //如果当前扩容后size依然超过了阈值,那么继续选取素数数组中下一个元素作为扩容大小
 
	//执行到这里说明哈希表的扩容大小已经确定,现在分配实际空间
    if ((new_table = mm_malloc(new_len*sizeof(struct event_map_entry*))))  //malloc分配扩容大小的空间 注意此时原来的哈希表依然存在 
    {
        unsigned b;
        memset(new_table, 0, new_len*sizeof(struct event_map_entry*));     //清空哈希表
 
		//这里不能直接用realloc来扩容,因此哈希表长度变化后各个元素在哈希表中的位置也会改变,因此需要hash,将原哈希表上的每个元素重新放置到新的哈希表上,包括未冲突的
		//实际上分配的只是一个新的哈希表的主链,新的哈希表和原来的哈希表对应同样的冲突链表
        for (b = 0; b < head->hth_table_length; ++b)  //遍历原来的哈希表
        {
            struct event_map_entry *elm, *next;
            unsigned b2;
 
            elm = head->hth_table[b];  //遍历哈希表上的主链的结点,然后再遍历主链结点所在的冲突链
            while (elm) //从该元素开始,检查它的map_node链表,看是否有冲突
            {
                next = elm->map_node.hte_next; //取得所属链表的下一个元素
				
#ifdef HT_CACHE_HASH_VALUES   //如果使用缓存的哈希值
                b2 = (elm)->map_node.hte_hash % new_len;   //直接用缓存的哈希值取模得到元素在哈希表上的索引
#else     //如果不使用缓存值就调用hashsocket获取哈希值 再取模
                b2 = (hashsocket(*elm)) % new_len;
#endif
                //用头插法插入数据
				//将该元素放到重新hash后的位置,这里相当于是头插法
                elm->map_node.hte_next = new_table[b2];   //更新该元素所在的冲突链表位置
                new_table[b2] = elm;  //将该元素放到重新hash后的位置
 
                elm = next;    //冲突链下一个元素
            }
        }
 
        if (head->hth_table)   //释放原来的哈希表
            mm_free(head->hth_table);
 
        head->hth_table = new_table;   //更新event_io_map中的哈希表
    }
    else    //新哈希表malloc扩容失败,前面可以看到,malloc分配后新老哈希表都同时存在,因此分配失败的原因可能是空间不够装下两个哈希表
    {       //尝试用realloc分配尝试是否能节约空间。realloc内部也会调用malloc分配一个新空间,然后将原空间中的数据复制过去后再释放原空间,
	        //因此在一般情况下即使使用realloc分配,在某一时刻内存中也会同时存在两个哈希表,内存不足的问题并不会得到解决
			//这里之所以使用realloc,是为了尝试realloc的特殊情况,如果原空间的后面刚好有一段空闲内存,并且与原空间加起来刚好可以放下新空间,那么就会直接在原空间上进行“增长”,这样就节省了内存
			//因此这里使用realloc并不一定就能改善空间状况,只是在malloc分配失败的情况下的一种尝试解决的办法,并不一定成功
        unsigned b, b2;
 
        
        new_table = mm_realloc(head->hth_table,
                               new_len*sizeof(struct event_map_entry*));   //用realloc进行重新分配,分配后直接将原哈希表上的主节点复制到新哈希表上,冲突链表还是原来的不变
 
        if (!new_table)  //如果realloc还是分配失败,就退出
            return -1;
		//执行到这里说明realloc分配成功,新分配的哈希表与原来的哈希表在原有位置上的延伸,延伸部分还需要初始化
        memset(new_table + head->hth_table_length, 0,
               (new_len - head->hth_table_length)*sizeof(struct event_map_entry*) //初始化延伸部分的空间
               );
 
        for (b=0; b < head->hth_table_length; ++b)   //遍历哈希表上的主节点
        {
            struct event_map_entry *e, **pE;
 
            for (pE = &new_table[b], e = *pE; e != NULL; e = *pE)   //从主节点开始遍历冲突链表
            {
				//计算重新哈希后在新哈希表中的位置
#ifdef HT_CACHE_HASH_VALUES
                b2 = (e)->map_node.hte_hash % new_len;
#else
                b2 = (hashsocket(*elm)) % new_len;
#endif
                //对于冲突链A->B->C.
                //pE是二级指针,存放的是A元素的hte_next指针的地址值
                //e指向B元素。
 
                //如果重新哈希取模后还是原来的位置
                if (b2 == b)
                {
                    //此时,无需修改。接着处理冲突链中的下一个元素即可
                    //pE向前移动,存放B元素的hte_next指针的地址值
                    pE = &e->map_node.hte_next;   //就不用更改当前结点,直接到冲突链下一个结点
                }
                else//重新哈希取模后需要改变位置
                {
                    *pE = e->map_node.hte_next;    //直接把当前结点的下一个结点放到当前结点的位置上,相当于从冲突链表中删除当前结点

                    e->map_node.hte_next = new_table[b2]; //再将当前结点以头插形式放到新的位置上去
                    new_table[b2] = e;
                }
 
                //这种再次哈希的方式,很有可能会对某些元素操作两次。
                //当某个元素第一次在else中处理,那么它就会被哈希到正确的节点
                //的冲突链上。随着外循环的进行,处理到正确的节点时。在遍历该节点
                //的冲突链时,又会再次处理该元素。此时,就会在if中处理。而不会
                //进入到else中。
            }
        }
 
        head->hth_table = new_table;  //更新哈希表
    }
	//更新event_io_map中的相关信息
    head->hth_table_length = new_len;
    head->hth_prime_idx = prime_idx;
    head->hth_load_limit = new_load_limit;
 
    return 0;
}

哈希表元素插入

       向哈希表中插入一个元素,就是先求得插入元素elm在哈希表中的位置,不管这个位置是否有元素,都直接以头插法的形式将新元素插在最前面。之所以采用头插法,是按照“最近新插入的元素可能在未来会被经常使用”的原则,插在链表头部这样即使发生了冲突,访问起来效率也更高。

static inline void
event_io_map_HT_INSERT(struct event_io_map *head,
                       struct event_map_entry *elm)  //哈希表插入一个元素
{
    struct event_map_entry **p;
    if (!head->hth_table || head->hth_n_entries >= head->hth_load_limit)
        event_io_map_HT_GROW(head, head->hth_n_entries+1);  //如果哈希表未分配,或者哈希表超到或者达到扩容阈值(表明不能再插入新元素),就需要扩容
 
    ++head->hth_n_entries; //哈希表元素加1
 
#ifdef HT_CACHE_HASH_VALUES
    do
    {   //计算哈希值并进行缓存,后面获取哈希值时就不需要再调用哈希函数了
        (elm)->map_node.hte_hash = hashsocket(elm);
    } while (0);
 
    p = &((head)->hth_table[((elm)->map_node.hte_hash)
            % head->hth_table_length]); //找到哈希表上该哈希值取模后的位置
#else
    p = &((head)->hth_table[(hashsocket(*elm))%head->hth_table_length]);
#endif
 
 
    //使用头插法,即后面才插入的链表,反而会在冲突链表头。  
    elm->map_node.hte_next = *p;
    *p = elm;
}

哈希表元素替换

       哈希表元素替换,实际上是替换元素的地址,先传入一个元素elm,然后寻找哈希表中与该元素fd相同的元素,然后将该元素的地址替换为新元素的地址,并将该元素的冲突链接在新元素的后面,从而完成替换。

static inline struct event_map_entry *
event_io_map_HT_REPLACE(struct event_io_map *head,
                        struct event_map_entry *elm)  //替换哈希表中的结点元素
{
    struct event_map_entry **p, *r;
 
    if (!head->hth_table || head->hth_n_entries >= head->hth_load_limit)   //如果哈希表未分配或者元素个数达到扩容阈值,那么就进行扩容
        event_io_map_HT_GROW(head, head->hth_n_entries+1);
 
#ifdef HT_CACHE_HASH_VALUES
    do
    {
        (elm)->map_node.hte_hash = hashsocket(elm);    //缓存哈希值
    } while(0);
#endif
 
    p = _event_io_map_HT_FIND_P(head, elm);    //p为哈希表中fd与elm相同的结点元素的地址
 
    r = *p; //保存原结点元素地址
    *p = elm; //给结点元素赋新值,这里是让哈希表上原来元素的地址换成了新元素的地址,完成了替换
 
    if (r && (r!=elm))    //如果原结点元素与新元素不同
    {
        elm->map_node.hte_next = r->map_node.hte_next;   //把原结点元素后面的冲突链接上去
 
        r->map_node.hte_next = NULL;   
        return r; //返回被替换掉的元素
    }
    else //到这里说明哈希表在新元素对应的地方没有元素,或者原结点元素与新结点元素就是同一个
    {
        ++head->hth_n_entries;   //为什么元素个数加1? 不明白
        return NULL; //返回NULL,表示哈希表中对应位置没有元素,无法完成替换,或者新老元素本身就相同,无需替换
    }
}

哈希表元素删除

       哈希表元素删除就是找到哈希表中某一个元素fd与传入参数elm的fd相同的元素并删除该元素。不过需要注意的是,这里并没有对被删除的元素进行释放,因此调用该函数后应当对返回值指针进行释放。

static inline struct event_map_entry *
event_io_map_HT_REMOVE(struct event_io_map *head,
                       struct event_map_entry *elm)   //哈希表元素删除
{
    struct event_map_entry **p, *r;
 
#ifdef HT_CACHE_HASH_VALUES
    do
    {
        (elm)->map_node.hte_hash = hashsocket(elm);
    } while (0);
#endif
 
    p = _event_io_map_HT_FIND_P(head,elm);   //p是找到的哈希表上元素的地址
 
    if (!p || !*p)//没有找到    //p为NULL说明哈希表未分配,*p为NULL说明没有找到elm
        return NULL;
 
    r = *p; //r指向要被删除的元素
    *p = r->map_node.hte_next;   //把该元素的地址换为它在冲突链上下一个元素的地址 实现删除
    r->map_node.hte_next = NULL;
 
    --head->hth_n_entries;   //元素数目减1
 
    return r;
}

自定义条件删除元素

       如前面的删除元素函数,是删除fd相同的那个元素,删除的依据就是fd相同。这里还提供了一种自己定义删除依据的删除方式:先自定义一个函数fn,在遍历哈希表元素的时候,将各个元素与传入的elm作为参数调用fn,如果fn返回true,那么就将哈希表中该元素删除,如下所示:(可以看到,在该函数中对于删除的元素并没有进行释放,并且也没有返回被删除元素的地址,这样也无法从外部对删除的元素进行释放)

static inline void
event_io_map_HT_FOREACH_FN(struct event_io_map *head,
                           int (*fn)(struct event_map_entry *, void *),
                           void *data)   //遍历哈希表上所有元素,以各个元素去调用fn,如果fn返回true则删除该元素
{
    unsigned idx;
    struct event_map_entry **p, **nextp, *next;
 
    if (!head->hth_table)
        return;
 
    for (idx=0; idx < head->hth_table_length; ++idx)   //遍历哈希表主链
    {
        p = &head->hth_table[idx];   //取哈希表主链上元素的地址
 
        while (*p)    //如果在该处有元素
        {
            nextp = &(*p)->map_node.hte_next;    //nextp保存哈希表上该元素在冲突链上下一个元素的地址
            next = *nextp;     //next保存该元素在冲突链上的下一个元素
 
            //对B元素进行检查
            if (fn(*p, data))
            {
                --head->hth_n_entries;
               
                *p = next;     //直接将该元素的地址替换为下一个元素的地址,相当于删除该元素
            }
            else
            {
                p = nextp;    //冲突链上下一个元素地址
            }
        }
    }
}

哈希表第一个非空元素

        哈希表第一个非空元素一定是在主链上,因此直接遍历哈希表的主链,不用去管冲突链,找到主链上第一个非空的元素返回其地址即可。由于主链上的元素都是event_map_entry *类型,因此这里返回的地址是event_map_entry **类型。

static inline struct event_map_entry **
event_io_map_HT_START(struct event_io_map *head) //返回哈希表主链上第一个非空元素的地址
{
    unsigned b = 0;
 
    while (b < head->hth_table_length)
    {
        if (head->hth_table[b])
            return &head->hth_table[b];
 
        ++b;
    }
 
    return NULL;
}

哈希表下一个元素

         这里提供了两个取下一个元素地址的函数event_io_map_HT_NEXT和event_io_map_HT_NEXT_RMV。前者是直接查找传入的elm所在冲突链上的下一个元素并返回其地址的指针,如果该元素是冲突链上最后一个元素,那么就从主链上找到下一个非空的元素,返回其地址的指针;后者则是返回下一个元素地址的指针,并且将elm从哈希表中删除。

static inline struct event_map_entry **
event_io_map_HT_NEXT(struct event_io_map *head,
                     struct event_map_entry **elm)  //返回elm在哈希表中下一个元素的地址的指针,先从elm所在冲突链中找到下一个元素,如果没有就从主链上下一个位置开始找
{
    if ((*elm)->map_node.hte_next)  //返回elm的下一个结点的地址
    {
        return &(*elm)->map_node.hte_next;
    }
    else //如果elm是其所在冲突链的最后一个结点,那么就找到下一条冲突链的第一个结点
    {
#ifdef HT_CACHE_HASH_VALUES
        unsigned b = (((*elm)->map_node.hte_hash)
                      % head->hth_table_length) + 1;   //从elm所在冲突链在主链上位置的后一个开始
#else
        unsigned b = ( (hashsocket(*elm)) % head->hth_table_length) + 1;
#endif
 
        while (b < head->hth_table_length)
        {
            //找到了第一个非空的结点,就返回该结点地址
            if (head->hth_table[b])
                return &head->hth_table[b];
            ++b;
        }
 
        return NULL;   //返回NULL说明elm所在冲突链包括主链后面都没有非空结点了
    }
}
static inline struct event_map_entry **
event_io_map_HT_NEXT_RMV(struct event_io_map *head,
                         struct event_map_entry **elm)   //返回哈希表上elm的下一个元素的地址,如果是在elm的冲突链上,那么就把elm删除
{
#ifdef HT_CACHE_HASH_VALUES
    unsigned h = ((*elm)->map_node.hte_hash);
#else
    unsigned h = (hashsocket(*elm));
#endif
	//h中保存elm对应的哈希值
    
    *elm = (*elm)->map_node.hte_next;  //elm冲突链上下一个元素的地址,这里也相当于直接用elm下一个元素的地址替换elm的地址,删除了哈希表上elm的地址
 
    --head->hth_n_entries;   //哈希表元素个数减1
 
    if (*elm)   //返回elm所在冲突链上下一个元素的地址
    {
        return elm;
    }
    else   //如果elm在其冲突链上是最后一个元素,那么就从后面的主链上找第一个非空的元素
    {
        unsigned b = (h % head->hth_table_length)+1;
 
        while (b < head->hth_table_length)
        {
            if (head->hth_table[b])
                return &head->hth_table[b];
 
            ++b;
        }
 
        return NULL;
    }
}

释放哈希表

void event_io_map_HT_CLEAR(struct event_io_map *head)    
{
    if (head->hth_table)    //释放哈希表
        mm_free(head->hth_table);
 
    head->hth_table_length = 0;
 
    event_io_map_HT_INIT(head);     //重新初始化event_io_map
}

向event_io_map中添加event

      如前所述,当对一个io event调用event_add时,Libevent就会把这个io event添加到event_io_map中,添加到event_io_map所调用的函数是evmap_io_add,其定义如下所示:

int
evmap_io_add(struct event_base *base, evutil_socket_t fd, struct event *ev)
{
	const struct eventop *evsel = base->evsel;    //得到event所绑定的base对应的后端方法
	struct event_io_map *io = &base->io;  //得到base对应的iomap
	struct evmap_io *ctx = NULL; //指向fd所对应的那个evmap_io,evmap_io中又含有一个event双向链表
	int nread, nwrite, retval = 0;
	short res = 0, old = 0;   //old用于记录下fd所对应的事件链表中在ev未插入前的所有事件对应了哪几种类型(write/read)
	struct event *old_ev;

	EVUTIL_ASSERT(fd == ev->ev_fd);   //确保传入的fd等于event的fd

	if (fd < 0)
		return 0;

#ifndef EVMAP_USE_HT   //如果不使用哈希,那么用的就是signal_map
	if (fd >= io->nentries) {   //如果fd大于当前哈希表中的元素数目就重新分配
		if (evmap_make_space(io, fd, sizeof(struct evmap_io *)) == -1)
			return (-1);
	}
#endif
	GET_IO_SLOT_AND_CTOR(ctx, io, fd, evmap_io, evmap_io_init,
						 evsel->fdinfo_len);
	//ctx就成为了fd对应的那个evmap_io的指针
	nread = ctx->nread;  //记录下fd所有event中读事件实木
	nwrite = ctx->nwrite;//记录下fd所有event中写事件数目

	if (nread)   //如果fd对应的事件链表中有读类型事件
		old |= EV_READ;  //表明在ev插入之前fd对应的event链表中就已经存在读类型事件了
	if (nwrite)  //如果fd对应的事件链表中有写类型事件
		old |= EV_WRITE; //表明在ev插入之前fd对应的event链表中就已经存在写类型事件了

	if (ev->ev_events & EV_READ) {   //如果添加的ev为读类型
		if (++nread == 1)   //读事件数目加1
			res |= EV_READ;
	}
	if (ev->ev_events & EV_WRITE) {   //如果添加的ev为写类型
		if (++nwrite == 1)  //写事件数目加1
			res |= EV_WRITE;
	}
	if (EVUTIL_UNLIKELY(nread > 0xffff || nwrite > 0xffff)) {
		event_warnx("Too many events reading or writing on fd %d",
		    (int)fd);
		return -1;
	}
    //此时还没有将ev插入到fd下的那个链表中,遍历整个链表,需要保证fd下的链表中所有event要么都是ET要么都不是ET,不能混合使用
	if (EVENT_DEBUG_MODE_IS_ON() &&
	    (old_ev = TAILQ_FIRST(&ctx->events)) &&
	    (old_ev->ev_events&EV_ET) != (ev->ev_events&EV_ET)) {
		event_warnx("Tried to mix edge-triggered and non-edge-triggered"
		    " events on fd %d", (int)fd);
		return -1;
	}

	if (res) {//如果有读或写事件,就将event添加到base中
		void *extra = ((char*)ctx) + sizeof(struct evmap_io);
		/* XXX(niels): we cannot mix edge-triggered and
		 * level-triggered, we should probably assert on
		 * this. */
		if (evsel->add(base, ev->ev_fd,
			old, (ev->ev_events & EV_ET) | res, extra) == -1)   //调用对应后端的add函数进行添加
			return (-1);
		retval = 1;
	}
	//记录fd下的读写event数量
	ctx->nread = (ev_uint16_t) nread; 
	ctx->nwrite = (ev_uint16_t) nwrite;
	TAILQ_INSERT_TAIL(&ctx->events, ev, ev_io_next);   //将event插入到fd对应的事件链表中

	return (retval);
}

       这里如果不是使用哈希结构的话,event_io_map实际上就相当于一个数组,数组的元素索引就对应了一个fd值,因此当fd大于或等于该数组的元素个数,说明此时该数组就需要扩容了,就调用evmap_make_space函数进行扩容,可以参考非windows下的event_io_map实现。

       需要注意的是,这里的evmap_add函数只是将event添加到Libevent自定义的数据结构evmap_io中,而真正添加到内核事件监听集合中的操作实际上是通过event_base所绑定的后端方法的add函数来实现的。可以参考libevent对epoll的封装。

激活event_io_map中的event

       激活event_io_map中的event使用的是evmap_io_active函数,不过这并不是一个对用户开放的接口。实现原理就是将fd对应的双向链表中发生了感兴趣事件的event通过event_active_nolock函数添加到激活队列中。其定义如下:

void
evmap_io_active(struct event_base *base, evutil_socket_t fd, short events)//将event_io_map中fd对应的event双向链表中关注事件类型与events有共同部分的事件添加到激活队列中
{
	struct event_io_map *io = &base->io;
	struct evmap_io *ctx;
	struct event *ev;

#ifndef EVMAP_USE_HT
	EVUTIL_ASSERT(fd < io->nentries);
#endif
	GET_IO_SLOT(ctx, io, fd, evmap_io);  //找到fd对应的event_io_map中的event双向链表

	EVUTIL_ASSERT(ctx);
	TAILQ_FOREACH(ev, &ctx->events, ev_io_next) {   //遍历该链表
		if (ev->ev_events & events)  //如果event的关注事件类型与发生的事件类型有共同部分
			event_active_nolock(ev, ev->ev_events & events, 1); //插入到激活队列中
	}
}

          event_active_nolock函数可以参考事件的激活。

删除event_io_map中的event

         evmap_io_del函数实际上就是evmap_io_add的逆操作,即是将event从event_io_map中删除,定义如下所示:

int
evmap_io_del(struct event_base *base, evutil_socket_t fd, struct event *ev)
{
	const struct eventop *evsel = base->evsel;
	struct event_io_map *io = &base->io;
	struct evmap_io *ctx;
	int nread, nwrite, retval = 0;
	short res = 0, old = 0;

	if (fd < 0)
		return 0;

	EVUTIL_ASSERT(fd == ev->ev_fd);

#ifndef EVMAP_USE_HT
	if (fd >= io->nentries)
		return (-1);
#endif

	GET_IO_SLOT(ctx, io, fd, evmap_io);  //ctx指向fd对应的那个evmap_io

	nread = ctx->nread;  //evmap_io中读事件数目
	nwrite = ctx->nwrite;//evmap_io中写事件数目
	//old保存删除前evmap_io中所有event的事件类型有哪些种类(读或写)
	if (nread)
		old |= EV_READ;
	if (nwrite)
		old |= EV_WRITE;

	if (ev->ev_events & EV_READ) {//如果需要被删除的事件对读事件感兴趣
		if (--nread == 0)    //读事件数目减1
			res |= EV_READ;
		EVUTIL_ASSERT(nread >= 0);
	}
	if (ev->ev_events & EV_WRITE) {//如果需要被删除的时间对写事件感兴趣
		if (--nwrite == 0) //写事件数目减1
			res |= EV_WRITE;
		EVUTIL_ASSERT(nwrite >= 0);
	}

	if (res) {
		void *extra = ((char*)ctx) + sizeof(struct evmap_io);
		if (evsel->del(base, ev->ev_fd, old, res, extra) == -1) //调用后端的del函数
			return (-1);
		retval = 1;
	}

	ctx->nread = nread;
	ctx->nwrite = nwrite;
	TAILQ_REMOVE(&ctx->events, ev, ev_io_next); //从evmap_io的双向链表中删除event

	return (retval);
}

       对于evmap_io_event函数本身来说,只是将这个event从Libevent自定义数据结构event_io_map中删除,而实际上将该事件从内核监听事件集合中删除的函数还是通过event_base所绑定的后端方法中的del函数实现的。可以参考libevent对epoll的封装

你可能感兴趣的:(libevent源码学习)