数据采集1+x初级试题及参考答案一、单选题(共40题,每题1分,共40分)1、获取页面中title标签的内容,xpath代码为()A、//title/@text()B、//title/text()C、//title/textD、//title/@text正确答案:B2、在Linux环境下的Apache容器数据的采集中,启动apache服务代码是()
A、startup
batB、logstashC、filebeatD、httpd正确答案:D3、哪个表达式用来选取当前节点
A、/B、@C、
正确答案:C4、哪个表达式用来选取属性
D、@正确答案:D5、()是通过爬虫程序监测某网站数据更新的情况,以便可以爬取到该网站更新的新数据,对于未发生内容变化的网页,则不会爬取
A、聚焦网络爬虫B、深层页面爬虫C、通用网络爬虫D、増量式网络爬虫正确答案:D6、HTML中能够定义表单提交位置的属性是A、methodB、actionC、titleD、name正确答案:B7、以下哪一项与网站优化关键词排名无关()A、网站开发语言B、网站空间稳定性C、网站域名D、网站程序复杂度正确答案:A8、用于将事务处理写到数据库的命令是()A、insertB、savepointC、commitD、rollback正确答案:C9、json模块中,()方法可以将python的字典和列表转换为json字符串A、dumpB、loadsC、dumpsD、load正确答案:C10、重新启动Apache服务命令为()A、ServicerestartB、HttpdrestartC、ServiceHttprestartD、Servicehttpdrestart正确答案:D11、BeautifulSoup中,能够获取标签内容的是A、stringB、textC、string()D、text()正确答案: