信息检索简介——文本处理、搜索引擎、数据挖掘、机器学习、推荐系统等

作者:禅与计算机程序设计艺术

1.简介

2005年8月17日至9月3日在美国加利福尼亚州伯克莱纳举行了SIGIR国际会议(中文全称“计算机信息retrieval国际会议”),这是信息检索领域的顶级会议之一。该会议由ACM主办,主题涵盖了包括文本处理、搜索引擎、数据挖掘、机器学习、推荐系统等多个热门方向。
此次会议是第一次将信息检索作为一个学科,并取得重大突破。本文试图对SIGIR进行一个完整的介绍,阐述其发展历史、相关术语、发表论文数量、会议规模、参会学者背景及主要研究方向。通过对其历次重要会议的介绍及与其他会议的比较,可以帮助读者更直观地了解信息检索领域的现状。

2. 会议背景介绍

2.1 发起与策划

信息检索作为一个领域,有着极高的学术性和工程价值,早期的研究工作就已经产生了很好的基础。欧洲核物理国家实验室(CERN)1950年创建了第一份报告,提出了“信息检索的基本概念”,它包括:文档、查询、索引、排序等。1961年,被选为第一届美国国际信息科技委员会(IET)代表,“检索”成为其核心业务方向之一。1971年,信息检索迎来了它的黄金十年,当时诞生了著名的“Information Retrieval Conference(ACM/IEEE SIGIR)”。1981年

你可能感兴趣的:(Python实战,自然语言处理,人工智能,语言模型,编程实践,开发语言,架构设计)