首页 > God Project > HTML解析模块完成

HTML解析模块完成

2009年11月15日

1.根据DTD文件构造HTML树
2.遍历出网页中所有肉眼能看到的东西
3.找出DIV块文本、找出TABLE块文本
4.根据DTD中的实体定义,将HTML转义符转成原有的字符

下一步计划,完成分词模块

God Project

  1. 目前还没有任何评论.
  1. 目前还没有任何 trackbacks 和 pingbacks.