FirteX-高性能全文索引和检索平台

API Documentation


首页 | 名字空间列表 | 类继承关系 | 组合类型列表 | $(BL\录(B | 文件列表 | 名字空间成员 | 组合类型成员 | 文件成员

firtex::parser::CParser类参考

#include <Parser.h>

继承图,类firtex::parser::CParser

firtex::parser::CPlainParser firtex::plugin::CParserPlugin 所有成员的列表。

公有成员

 CParser (void)
virtual ~CParser (void)
virtual tstring getCategory ()
virtual tstring getIdentifier ()
firtex::document::CDocumentparse (CIndexParameter *pArg)
virtual void close ()
virtual void setTermVector (const tchar *field, TermVector_ tv)
virtual TermVector_ getTermVector (const tchar *field)

静态公有属性

const tstring category
const tstring identifier

保护成员

virtual bool parseInternal (CIndexParameter *pArg)=0
virtual void defineSchema (CDocumentSchema *pSchema)=0
virtual tstring getFileType ()=0
firtex::document::CDocumentgetDocument ()

保护属性

firtex::document::CDocumentm_pCachedDoc
tstring m_identifier
map< tstring, TermVector_m_termVectors

详细描述

分析器抽象基类,用于分析文档内容并生成内部文档对象


构造及析构函数文档

firtex::parser::CParser::CParser void   ) 
 

virtual firtex::parser::CParser::~CParser void   ) 
 


成员函数文档

virtual void firtex::parser::CParser::close  )  [virtual]
 

关闭分析器,子类重载后需显式调用CParser::close()

firtex::parser::CPlainParser重载。

virtual void firtex::parser::CParser::defineSchema CDocumentSchema pSchema  )  [protected, pure virtual]
 

定义文档的schema,子类必须实现此接口

参数:
pSchema schema对象

firtex::parser::CPlainParserfirtex::plugin::CParserPlugin内被实现。

virtual tstring firtex::parser::CParser::getCategory  )  [inline, virtual]
 

获取parser的所属分类,对于parser总是返回"parser"

firtex::document::CDocument * firtex::parser::CParser::getDocument  )  [inline, protected]
 

virtual tstring firtex::parser::CParser::getFileType  )  [protected, pure virtual]
 

获取这个parser可以处理的文件类型

firtex::parser::CPlainParserfirtex::plugin::CParserPlugin内被实现。

virtual tstring firtex::parser::CParser::getIdentifier  )  [inline, virtual]
 

返回parser的标识

virtual TermVector_ firtex::parser::CParser::getTermVector const tchar *  field  )  [virtual]
 

获取字段的词向量属性,参见CField::TermVector

参数:
field 字段名
返回:
词向量方式,

firtex::plugin::CParserPlugin重载。

firtex::document::CDocument * firtex::parser::CParser::parse CIndexParameter pArg  )  [inline]
 

解析文档

返回:
返回解析完毕的文档对象 内部对象,外部不能删除

virtual bool firtex::parser::CParser::parseInternal CIndexParameter pArg  )  [protected, pure virtual]
 

解析文档,子类必须实现此接口

参数:
pArg 索引参数
返回:
解释成功则返回true,否则false

firtex::parser::CPlainParserfirtex::plugin::CParserPlugin内被实现。

virtual void firtex::parser::CParser::setTermVector const tchar *  field,
TermVector_  tv
[virtual]
 

设置字段的词向量属性,参见CField::TermVector

参数:
field 字段名
tv 词向量方式,

firtex::plugin::CParserPlugin重载。


成员数据文档

const tstring firtex::parser::CParser::category [static]
 

firtex::parser::CPlainParser重载。

const tstring firtex::parser::CParser::identifier [static]
 

firtex::parser::CPlainParser重载。

tstring firtex::parser::CParser::m_identifier [protected]
 

firtex::document::CDocument* firtex::parser::CParser::m_pCachedDoc [protected]
 

map<tstring,TermVector_> firtex::parser::CParser::m_termVectors [protected]
 


该类的文档由以下文件生成:

http://www.firtex.org http://www.sourceforge.net/projects/firtex