最新消息
简介
特性
关于我们
邮件列表
所获奖项new
 
开始使用
FAQ
检索语法
索引文件格式
文档
论坛
 
程序&源代码
插件
相关资料
学术论文new
 
中科院计算所
学术讲座
搜索论坛
中科计算技术转移中心
CnPack开发网站
 
  您现在的位置:首页 > 检索语法 > 正文
 

检索语法

 

最后修改:2006-10-05

 
词语和短语检索

词语是指词典中收录的词,在解析的时候被当作一个独立的词语。短语由1个或多个词语组成。查询表达式是查询词或带引号的查询词,例如,词语查询:

中国 "中国"

短语查询:

中国科学院计算技术研究所 "中国科学院计算技术研究所"

对于短语检索,解析器会自动将短语切成多个词语,在检索时自动进行位置匹配,返回与查询精确匹配的结果。

 
多字段检索

索引包含多个字段时,可以指定在某个特定的字段中进行检索,如果没有指定字段名,则使用默认的字段;也可以跨多个字段检索。例如,需要在TITLE字段中查找信息检索:

TITLE:信息检索 或者 TITLE:"信息检索"

查找在标题中包含中国科学院,在正文中包含信息检索:

TITLE:中国科学院 AND CONTENTS:信息检索

如果CONTENTS设置的是默认字段,也可以表示如下:

TITLE:中国科学院 AND 信息检索

 
布尔检索

OR 操作符:

OR操作符是默认的查询连接符,如果两个词语或短语中间用空格隔开,则默认用OR连接这两个查询,例如:

中国 北京 等同于 中国 OR 北京

查询在同一文档中出现 中科院 或者 中国科学院,表达式如下:

中科院 OR 中国科学院

不允许单独使用OR操作符,例如:

OR 中科院

将返回0个结果。

AND 操作符:

AND操作符查询在同一个文档中同时出现查询词的文档,例如,查询在同一文档中同时出现 北京 和 奥运:

北京 AND 奥运

NOT 操作符:

NOT操作符查询不出现查询词的文档,例如查询在同一文档中出现搜索引擎但不出现信息检索:

搜索引擎 NOT 信息检索

+ 操作符:

+操作符查询必须出现查询词的文档,例如查询必须包含北京可以包含中国:

+北京 中国

- 操作符:

-操作符查询不能出现查询词的文档,例如查询包含北京不能包含中国的文档:

北京 -中国

 
范围查询

日期范围查询:

如果在建立索引时包含了时间日期字段或者指定了对文件的修改时间进行存储或建立索引,则可以使用时间日期范围检索,例如:

modified:[2004-4-10 TO 2005-3-6]

将返回2004年4月10日至2005年3月6日的文档,包含边界值,如果要排除边界值则使用:

modified:{2004-4-10 TO 2005-3-6}

数字范围查询:

对于数字类型的字段,同样可以指定范围查询,例如:

vistit_count:[123 TO 456]

将检索visit_count字段值从123至456的文档,包含123和456。如果要排除123和456,则使用:

vistit_count:{123 TO 456}

 
查询分组

FirteX支持对查询进行分组,这样可以避免查询歧义,实现"二取一"的查询,例如查询出现"中国" 并且出现"北京"或者"上海"可以使用下面的查询表达式:

中国 AND (上海 OR 北京)

上述查询和查询:

中国 AND 上海 OR 北京

是不一样的,后一查询表达式查询出现中国和上海,或者同时出现北京的文档

 
字段分组

FirteX支持对查询的字段进行分组,例如查询:

TITLE:(中国 AND 北京) 等同于 TITLE:中国 AND TITLE:北京

 
软件许可证|BUG报告|联系我们

Copyright (c) 2005-2006 版权所有 中科院计算所智能软件部

SourceForge.net Logo
查看在SourceForge.net上的FirteX's Project Page