长风破浪会有时,直挂云帆济沧海。住在富人区的她南开大学智慧树知到“计算机科学与技术”《网络爬虫与信息提取》网课测试题答案(图片大小可自由调整)第1卷一.综合考核(共15题)1.在发送请求时需要注意requests提交的请求头不能与浏览器的请求头一致,因为这样才能隐藏好自己达到获取数据的目的。()A.正确B.错误2.某些网站在发起Ajax请求时会携带()字符串用于身份验证A.TokenB.CookieC.ReqTimeD.sum3.对Charles设置代理时,Ip可以设置为127.0.0.1,端口为8888。()T.对F.错4.在配置ios使用Charles的操作中,正确的有()A.对于苹果设备,首先要保证计算机和苹果设备联在同一个Wi-Fi上B.选择“HTTP代理”下面的“手动”选项卡,在“服务器”处输入计算机的IP地址,在“端口”处输入8888C.输入完成代理以后按下苹果设备的Home键,设置就会自动保存D.安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任5.MongoDB中获取名字为set1的集合的语句为()A.database.set1B.database('set1')C.database['set1']D.database{'set1'}6.下面关于Charles使用说法错误的是()A.在数据包非常多的情况下,使用Charles的过滤功能来对数据包进行过滤从而减少干扰B.通过单击图中方框框住的各个选项卡,可以非常直观地观察到请求和返回的各种信息C.如果浏览器是Chrome,在没有安装第三方代理插件的情况下,Chrome的HTTP流量都会经过CharlesD.Charles无法支持计算机上除了浏览器之外的其他软件7.device.sleep()方法是使用UIAutomatorr关闭屏幕的命令。()A.正确B.错误8.process_spider_input(response,spider)是在爬虫运行yielditem或者yieldscrapy.Request()的时候调用。()T.对F.错9.最常见的HTTP请求类型有()A.GETB.POSTC.SENDD.RECEIVE10.为了在安卓手机上安装证书,需要先发送证书到手机里面。在Charles中选择“Help”-“SSLProxying”-“SaveCharlesRootCertificate”命令,可以将Charles的证书保存到计算机桌面。()T.对F.错11.Python中包含字典的列表页可以转换成JSON字符串。()A.正确B.错误12.默认情况下,MongoDB可以通过外网访问。()A.正确B.错误13.插入数据时,MongoDB会自动添加一列“_id”,也就是自增ID,每次自动加1。()T.对F.错14.xpath中extract方法返回值类型是()。A.列表B.元组C.字典D.集合15.当运行爬虫代码后,出现“Forbiddenbyrobots.txt”提示后,说明当前时间段被爬取的网站无法访问。()长风破浪会有时,直挂云帆济沧海。住在富人区的她A.正确B.错误第2卷一.综合考核(共15题)1.Scrapy中使用Xpath获得的结果调用了.extract方法,结果以()形式生成A.列表B.元组C.字典D.集合2.使用Selennium获取网页中元素的方法有()A.find_element_by_nameB.find_element_by_idC.find_elements_by_nameD.find_elements_by_id3.自己能查看的数据,允许擅自拿给第三方查看。()T.对F.错4.Charles是一个收费软件,如果没有注册,安装以后的前30天可以正常使用。30天以后,虽然功能不会缩水,但每过30分钟Charles会自动关闭一次。()T.对F.错5.在Scrapy的目录下,哪个文件负责定义需要爬取的数据?()A.spiders文件夹B.item.pyC.pipeline.pyD.settings.py6.Python中若定义object=(1,2,3,4,5),则print(object[::3])输出()。A.345B.34C.45D.1237.Python中退出循环应用关键字()。A.breakB.continueC.exitD.return8.chrome开发者工具没法对数据进行搜索。如果想知道一个特定的异步加载内容来自哪个请求,必须在“Network”选项卡里面一个请求一个请求地进行查看。()T.对F.错9.MongoDB中可以将()数据结构插入集合中A.列表B.元组C.字典D.集合10.一般来说在页面都通过GET将用户登录信息传递到服务器端。()A.正确B.错误11.HTTP常用状态码表明请求被正常处理的有()。A.200B.301C.302D.20412.“curlIP地址:6800/cancel.json-dproject=工程名-djob=爬虫JOBID”该命令的作用是启动爬虫。()A.正确B.错误13.HTTP常用状态码表明表明客户端是发生错误的原因所在的有()。A.403B.404C.500D.50314.在请求头中设置User-Agent即可正常请求网站。()A.正确B.错误15.Py...