垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。
垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据,好比网页搜索是以网页为最小单位,基于视觉的网页块分析是以网页块为最小单位,而垂直搜索是以结构化数据为最小单位。然后将这些数据进行进一步的加工处理,如:去重、分类等,最后分词、建立索引再以搜索的方式满足用户的需求。
本公司的搜索引擎产品是典型的垂直性搜索引擎,可以广大应用于以下领域:
商业情报采集和分析;
企业竞争情报系统CIS(Competitive Intelligence System)新闻监测和分析;
情报采集和跟踪;
网站门户,内外网信息发布,办公系统信息化建设;
电子商务,信息分门归类及整合;
各种媒体和出版行业;
档案管理系统;
数字图书馆,电子书;
各种应用系统数据信息的管理、分析和挖掘;