1、信息抽取信息抽取的定义为:从自然语言文本中抽取指定类型的实体、关系、事件等事实信息,并形成结构化数据输出的文本处理技术。信息抽取有许多不同的用途,一种典型的应用是使用信息抽取面向特定任务的结构化信息,互联网的快速发展产生了海量的信息,由于文本数据的多样性和异构性,对这些的信息进行检索和处理受到很大的限制,而信息抽取则致力于将这些信息转化成结构化的数据,满足搜索引擎和数据挖掘等相关应用。另一种典型的应用是特定目标信息的发现和识别(如发现与“人工智能”相关的新闻)。在现在的Web中,相关的信息往往被无关