测试日期:2006年8月13日
测试版本:1.0.2 beta
测试环境: Windows 2000 Advance Server,P4 2.8G(2CPU),2G RAM,共5个纯文本数据集,从北大天网CWT100G中文网页语料中提取,文件大小5k~30k
索引性能:
|
corpus1 |
corpus2 |
corpus4 |
corpus8 |
corpus11 |
| 索引内存(M) |
1024 |
| 索引合并因子 |
10 |
| 停用词(中/英文)(个) |
961 |
| CPU平均占用率 |
49% |
| 原始数据大小(G) |
1.0 |
2.0 |
4.0 |
8.0 |
11.5 |
| 物理文件数(个) |
2 |
3 |
5 |
9 |
6 |
| 文档总数(个) |
60183 |
120367 |
240792 |
482319 |
699247 |
| 索引大小(G) |
0.49 |
0.99 |
1.97 |
3.99 |
5.82 |
| 总时间(s) |
247.11 |
573.15 |
1277.34 |
2603.33 |
3150.74 |
| 平均时间(M/min) |
248.4 |
214.2 |
193.2 |
189.0 |
224.4 |
检索性能:
| |
corpus1 |
corpus2 |
corpus4 |
corpus8 |
corpus11 |
| 检索使用内存峰值(M) |
16.61 |
16.07 |
14.85 |
17.0 |
17.4 |
| 索引大小(G) |
0.49 |
0.98 |
1.97 |
3.97 |
5.80 |
| 测试查询总数 |
109641 |
| 查询词平均长度(字) |
2.5 |
| 命中结果数(个) |
71,345,331 |
140,474,915 |
280,155,094 |
570,921,066 |
838,464,138 |
| 总时间(s) |
75.42 |
80.23 |
109.06 |
171.28 |
264.45 |
| 平均时间(ms/q) |
0.69 |
0.73 |
0.99 |
1.56 |
2.41 |
注:检索是在索引优化合并后进行,仅检索词典收录词 |