一般
-
FirteX 的主要目标是什么?
本项目的目标用户群体是需要提供站内搜索服务的动态网站、垂直搜索引擎服务商和搜索技术研究人员。 主要目标一方面是作为高性能和灵活的基础平台为产品搜索,桌面搜索,站内搜索,新闻搜索,博客搜索,学术搜索以及大规模搜索引擎等应用的开发者提供开发包,另一方面是作为学术研究平台研究文本索引的快速构建,动态文档集的索引维护,短语查询 ,Top-k 查询的快速处理以及各种检索模型等搜索相关技术。
- FirteX 可以用来做什么?
一方面,可以用来搭建各种搜索应用,例如桌面搜索、本地搜索、站内搜索、垂直搜索等应用;另一方面,可以作为一个搜索技术研究平台,搭建各种信息检索实验平台。
- FirteX 都有什么功能?
FirteX 可以对各种格式、各种语言的文档建立索引,并提供了丰富的检索语法和检索方式,更详细的功能可以参见特性一节。
- FirteX 是用什么语言实现的?
采用 C++ 实现。
- FirteX 的性能如何?
FirteX 的性能是目前国际上主流开源搜索平台的 3 至 9 倍 , 在单台 Pentium 4 2.8G 2GRAM 的机器上超过 200Mb 每分钟的纯文本索引速度,建立索引后在近 100G 的网页上搜索,能在数毫秒内返回结果。
- 是否支持插件扩展系统?
支持。插件是标准的 COM 插件,如果使用 FirteX 的 com 运行库,则插件同时可以在 Linux 平台下使用。
- 是否支持程序运行记录记载?
支持。有多级记录方式,可以通过配置文件关闭或打开 LOG 记录。
- 目前 FirteX 代码量有多大?
代码总量 11 万行左右, FirteX 核心部分代码近 6 万行。
- 是否支持 Tb 级别数据处理?
支持。
- FirteX 是否是线程安全的?
Beta2 版不是,正在开发中。
索引
-
如果我要索引的文档格式 FirteX 不支持怎么办?
编写一个 FirteX 的文本格式解析器 (Parser) ,既可以采用 C++ 编写直接加入 FirteX 代码库,也可以编写 COM 插件加入系统使用。
- 如果我要索引的文档语言 FirteX 不支持怎么办?
编写一个 FirteX 的文本内容分析器 (Analyzer) ,既可以采用 C++ 编写直接加入 FirteX 代码库,也可以编写 COM 插件加入系统使用。
- 是否支持增量索引和索引文档的删除?
支持。
搜索
-
FirteX 支持检索模型方面的科学试验吗?
支持,目前 FirteX 提供了向量空间模型,其他模型也可以很好实现。
- 方便实现自己的索引器吗?或者说是否支持索引算法方面的试验?
支持,而且很方便,仅需要按照索引器接口实现即可,系统其他部分不用修改。
- 是否支持多字段索引和检索?
支持。
- 是否支持时间日期检索和检索结果按时间日期排序 ?
支持。
- 是否支持内存检索以加快检索速度?
支持。
|