一:学会如何读一个JavaWeb 项目源代码 步骤:表结构->web
xml->mvc->db->spring ioc->log->代码 1、先了解项目数据库的表结构,这个方面是最容易忘记的,有时候我们只顾着看每一个方法是怎么进行的,却没有去了解数据库之间的主外键关联
其实如果先了解数据库表结构,再去看一个方法的实现会更加容易
2、然后需要过一遍 web
xml,知道项目中用到了什么拦截器,监听器,过滤器,拥有哪些配置文件
如果是拦截器,一般负责过滤请求,进行 AOP 等;如果是监 听器,可能是定时任务,初始化任务;配置文件有如 使用了spring 后的读取 mvc 相关,db 相关,service 相关,aop相关的文件
3、查看拦截器,监听器代码,知道拦截了什么请求,这个类完成了怎样的工作
有的人就是因为缺少了这一步,自己写了一个action,配置文件也没有写错,但是却怎么调试也无法进入这个action,直到别人告诉他,请求被拦截了
4、接下来,看配置文件,首先一定是 mvc 相关的,如springmvc 中,要请求哪些请求是静态资源,使用了哪些view 策略,controller 注解放在哪个包下等
然后是 db 相关配置文件,看使用了什么数据库,使用了什么 orm 框架,是否开启了二级缓存,使用哪种产品作为二级缓存,事务管理的处理,需要扫描的实体类放在什么位置
最后是 spring 核心的 ioc 功能相关的配置文件,知道接口与具体类的注入大致是怎样的
当然还有一些如apectj 等的配 置文件,也是在这个步骤中完成 5、log 相关文件,日志的各个级别是如何处理的,在哪些地方使用了 log 记录日志 6、从上面几点后知道了整个开源项目的整体框架,阅读每个方法就不再那么难了
7、当然如果有项目配套的开发文档也是要阅读的
二:爬虫是如何实现的: 获取规则