FirteX-高性能全文索引和检索平台API Documentation |
#include <Parser.h>
继承图,类firtex::parser::CParser

公有成员 | |
| CParser (void) | |
| virtual | ~CParser (void) |
| virtual tstring | getCategory () |
| virtual tstring | getIdentifier () |
| firtex::document::CDocument * | parse (CIndexParameter *pArg) |
| virtual void | close () |
| virtual void | setTermVector (const tchar *field, TermVector_ tv) |
| virtual TermVector_ | getTermVector (const tchar *field) |
静态公有属性 | |
| const tstring | category |
| const tstring | identifier |
保护成员 | |
| virtual bool | parseInternal (CIndexParameter *pArg)=0 |
| virtual void | defineSchema (CDocumentSchema *pSchema)=0 |
| virtual tstring | getFileType ()=0 |
| firtex::document::CDocument * | getDocument () |
保护属性 | |
| firtex::document::CDocument * | m_pCachedDoc |
| tstring | m_identifier |
| map< tstring, TermVector_ > | m_termVectors |
|
|
|
|
|
|
|
|
关闭分析器,子类重载后需显式调用 |
|
|
定义文档的schema,子类必须实现此接口
在firtex::parser::CPlainParser及firtex::plugin::CParserPlugin内被实现。 |
|
|
获取parser的所属分类,对于parser总是返回"parser" |
|
|
|
|
|
获取这个parser可以处理的文件类型 在firtex::parser::CPlainParser及firtex::plugin::CParserPlugin内被实现。 |
|
|
返回parser的标识 |
|
|
获取字段的词向量属性,参见
|
|
|
解析文档
|
|
|
解析文档,子类必须实现此接口
在firtex::parser::CPlainParser及firtex::plugin::CParserPlugin内被实现。 |
|
||||||||||||
|
设置字段的词向量属性,参见
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
http://www.firtex.org http://www.sourceforge.net/projects/firtex