pythonpymissingparenthesesiscallto'print'原因:#python3printprint('hellwworld')print(2**8)python3.3.2:SyntaxError:invalidcharacterinidentifier50 原因:存在中文标点符号pythonHTTP先来说一说 HTTP 的异常处理问题。当 urlopen 不能够处理一个 response 时,产生 urlError。不过通常的 PythonAPIs 异常如 ValueError,TypeError 等也会同时产生。HTTPError 是 urlError 的子类,通常在特定 HTTPURLs 中产生。1. URLError通常,URLError 在没有网络连接(没有路由到特定服务器),或者服务器不存在的情况下产生。这种情况下,异常同样会带有"reason"属性,它是一个 tuple(可以理解为不可变的数组),包含了一个错误号和一个错误信息。我们建一个 urllib2_test06.py 来感受一下异常的处理:复制代码代码如下:importurllib2req=urllib2.Request('http://www.baibai.com')try:urllib2.urlopen(req)excepturllib2.URLError,e:printe.reason按下 F5,可以看到打印出来的内容是:[Errno11001]getaddrinfofailed也就是说,错误号是 11001,内容是 getaddrinfofailed2.HTTPError服务器上每一个 HTTP 应答对象 response 包含一个数字"状态码"。有时状态码指出服务器无法完成请求。默认的处理器会为你处理一部分这种应答。例如:假如 response 是一个"重定向",需要客户端从别的地址获取文档,urllib2 将为你处理。其他不能处理的,urlopen 会产生一个 HTTPError。典型的错误包含"404"(页面无法找到),"403"(请求禁止),和"401"(带验证请求)。HTTP 状态码表示 HTTP 协议所返回的响应的状态。比如客户端向服务器发送请求,如果成功地获得请求的资源,则返回的状态码为 200,表示响应成功。如果请求的资源不存在,则通常返回 404 错误。HTTP 状态码通常分为 5 种类型,分别以 1〜5 五个数字开头,由 3 位整数组成:200:请求成功处理方式:获得响应的内容,进行处理201 请求完成,结果是创建了新资源。新创建资源的 URI 可在响应的实体中得到处理方式:爬虫中不会遇到202:请求被接受,但处理尚未完成处理方式:阻塞等待204:服务器端已经实现了请求,但是没有返回新的信息。如果客户是用户代理,则无须为此更新自身的文档视图。处理方式:丢弃300:该状态码不被 HTTP/1.0 的应用程序直接使用,只是作为 3XX 类型回应的默认解释。存在多个可用的被请求资源。处理方式:若程序中能够处理,则进行进一...