电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

南开19春学期1709、1803、1809、1903网络爬虫与信息提取在线作业(黄金题型)002精品VIP免费

南开19春学期1709、1803、1809、1903网络爬虫与信息提取在线作业(黄金题型)002精品_第1页
1/21
南开19春学期1709、1803、1809、1903网络爬虫与信息提取在线作业(黄金题型)002精品_第2页
2/21
19春学期(1709、1803、1809、1903)《网络爬虫与信息提取》在线作业-0002试卷总分:100得分:0一、单选题(共20道试题,共40分)1.Python操作CSV文件可通过()容器的方式操作单元格A.列表B.元组C.字典D.集合正确答案:C2.以下哪个HTML标签表示分区或节()A.B.C.D.正确答案:A3.Python中若定义object=(1,2,3,4,5),则print(object[1:3])输出()A.12B.123C.23D.234正确答案:C4.Redis中读取数据语句lrangechapter03,那么表示读列表中()个值A.2B.3C.4D.5正确答案:C5.HTTP常用状态码表明服务器正忙的是()A.500B.503C.403D.404正确答案:B6.MongoDB中可以将()数据结构插入集合中A.列表B.元组C.字典D.集合正确答案:C7.Redis中查看一个列表长度,使用关键字()A.lenB.lengthC.llenD.count正确答案:C8.网站根目录中哪个文件里面的内容会告诉爬虫哪些数据是可以爬取的,哪些数据是不可以爬取的()。A.robot.txtB.robot.htmlC.robots.txtD.robots.html正确答案:C9.使用UIAutomator使屏幕向上滚动一屏的操作是得到相应控件后使用命令()A.scroll_forwadB.scroll_upC.scroll.forwardD.scroll.vert.forward正确答案:D10.在Python中,为了使用XPath,需要安装一个第三方库()A.lxmlB.xmlC.xpathD.path正确答案:A11.下列关于mitmproxy的安装说法错误的是()A.对于MacOS系统,使用Homebrew安装mitmproxy,命令为:brewinstallmitmproxyB.在Ubuntu中,要安装mitmproxy,首先需要保证系统的Python为Python3.5或者更高版本C.在windows系统中无法使用linux的命令,只能通过下载安装包来安装D.UBUNTU中执行命令sudopip3installmitmproxy进行安装正确答案:C12.Redis中从集合中查看有多少个值,用关键字()A.scardB.cardC.countD.distinct正确答案:A13.requests获取get或者post请求后需要通过()属性获取文本内容A.contentB.textC.stringD.body正确答案:A14.查看网站请求一般在Chrome开发者模式下的()选项卡中查看A.ConsoleB.SourcesC.NetworkD.Performance正确答案:C15.某些网站在发起Ajax请求时会携带()字符串用于身份验证A.TokenB.CookieC.ReqTimeD.sum正确答案:A16.Redis中往集合中读数据,使用关键字()A.popB.spopC.lpopD.range正确答案:B17.Python中Object=(1,2,3,4,5),则Objcet是()A.列表B.元组C.字典D.集合正确答案:B18.打码平台一般通过()识别验证码。A.人工识别B.机器学习识别C.光学字符识别D.深度学习识别正确答案:A19.以下哪个HTML标签表示定义文档或节的页脚()A.B.C.D.正确答案:D20.Chrome的开发者工具中哪个选项可以查找到cookiesA.ElementsB.SourcesC.NetworkD.Peformance正确答案:C二、多选题(共10道试题,共20分)1.如果目标网站有反爬虫声明,那么对方在被爬虫爬取以后,可以根据()来起诉使用爬虫的公司A.服务器日志B.数据库日志记录C.程序日志记录D.服务器监控正确答案:ABCD2.常用的会话跟踪技术是A.sessionB.cookiesC.moonpiesD.localstorage正确答案:AB3.下列关于在IOS上配置charles的说法正确的是()A.不同ios设备之间会有比较大的差别,所以配置的时候需要找到对应的安装证书的入口。B.手机和电脑需要在同一个局域网下。C.HTTP代理可以使用“自动”选项。D.安装好证书以后,打开iOS设备上的任何一个App,可以看到Charles中有数据包在流动正确答案:BD4.使用Selennium获取网页中元素的方法有A.find_element_by_nameB.find_element_by_idC.find_elements_by_nameD.find_elements_by_id正确答案:ABCD5.要使用tesseract来进行图像识别,需要安装两个第三方库A.requestsB.beautifulsoupC.PillowD.pytesseract正确答案:CD6.一个可行的自动更换代理的爬虫系统,应该下列哪些功能?A.有一个小爬虫ProxySpider去各大代理网站爬取免费代理并验证,将可以使用的代理IP保存到数据库中B.在发现某个请求已经被设置过代理后,什么也不做,直接返回C.在ProxyMiddlerware的process_request中,每次从数据库里面随机选择一条代理IP地址使用D.周期性验证数据库中的无效代理,及时将其删除正确答案:ACD7.HTTP常用状态码表明请求被正常处理的有()A.200B.301C.302D.204正确答案:AD8.BS4可以用来从()中提取数据A.HTMLB.XMLC.数据库D.JSON正确...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

南开19春学期1709、1803、1809、1903网络爬虫与信息提取在线作业(黄金题型)002精品

您可能关注的文档

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部