书山有路勤为径,学海无涯苦作舟
住在富人区的她南开大学22春“计算机科学与技术”《网络爬虫与信息提取》作业考核题库高频考点版(参考答案)一
综合考核(共50题)1
使用Nginx反向代理到Scrapyd以后,Scrapyd本身只需要开通内网访问即可,不许经过输入密码
错误参考答案:A2
如果爬虫爬取的是商业网站,并且目标网站使用了反爬虫机制,那么强行突破反爬虫机制可能构成()A
非法侵入计算机系统罪B
非法获取计算机信息系统数据罪C
非法获取计算机数据罪D
非法获取系统罪参考答案:AB3
Scrapy每一次发起请求之前都会在这里检查网址是否重复
因此如果确实需要再一次爬取数据,在Redis中把这个Key删除即可
错误参考答案:A4
为了解决爬虫代码本身的错误引起的异常,可以采用下列哪些方法
仔细检查代码B
开发爬虫中间件C
开发下载器中间件D
等待参考答案:AB书山有路勤为径,学海无涯苦作舟
住在富人区的她5
PyMongo更新操作有()
updateB
update_allC
update_oneD
update_many参考答案:CD6
Python中哪种容器一旦生成就不能修改
集合参考答案:B7
如果目标网站本身就是提供公众查询服务的网站,那么使用爬虫是合法合规的
错误参考答案:A8
Python中把列表转换为集合需要使用()函数
convertD
change参考答案:A9
HTTP常用状态码表明服务器正忙的是()A
503书山有路勤为径,学海无涯苦作舟
住在富人区的她C
404参考答案:B10
虽然MongoDB相比于MySQL来说,速度快了很多,但是频繁读写MongoDB还是会严重拖慢程序的执行速度