Python 面试题总结1.Python 线程池原理? 我理解为线程池是一种寄存诸多线程的单位,同步尚有一种对应的任务队列。整个执行过程其实就是使用线程池中已经有有限的线程把任务队列中的任务做完。这样做的好处就是你不需要为每个任务都创立一种线程,由于当你创立第100 个线程来执行第 100 个任务的时候,也许前面已经有 50 个线 程结束工作了。超过最大值的线程可以排队,但她们要等到其他线程完毕后才启动。因此反复运用线程来执行任务,减少系统资源的开销。 2.Python 合并字典,相似 key 的 value 怎样相加?运用 collections.Counter 可轻松办到>>> x = { 'apple': 1, 'banana': 2 }>>> y = { 'banana': 10, 'pear': 11 }>>> from collections import Counter>>> X,Y = Counter(x), Counter(y)>>> z = dict(X+Y)>>> z{'apple': 1, 'banana': 12, 'pear': 11}另一种写法>>>from collections import Counter>>>dict(Counter(x)+Counter(y)) ( 合并两个字典的措施措施 1:dictMerged1=dict(dict1.items()+dict2.items())措施 2:dictMerged2=dict(dict1, **dict2)措施 2 等同于:dictMerged=dict1.copy()dictMerged.update(dict2)或者dictMerged=dict(dict1)dictMerged.update(dict2)3.解释 GUI 和 GPL?GUI 图形顾客界面(Graphical User Interface,简称 GUI,又称图形顾客接口)是指采用图形方式显示的计算机操作顾客界面。 GPL(GNU 通用公共许可证 )GPL 同其他的自由软件许可证同样,许可社会公众享有:运行、复制软件的自由,发行传播软件的自由,获得软件源码的自由,改善软件并将自己作出的改善版本向社会发行传播的自由。 4.简述爬虫的基本环节和流程? 网络爬虫的基本工作流程如下: 1.首先选用一部分精心挑选的 URL; 2.将这些 URL 放入待抓取 URL 队列; 3.从待抓取 URL 队列中取出待抓取在 URL,(解析 DNS,并且得到主机的ip,)并将 URL 对应的网页下载下来,存储进已下载网页库中。此外,将这些URL 放进已抓取 URL 队列。4.分析已抓取 URL 队列中的 URL 和其中的有价值的数据,将新的 URL,放入待抓取 URL 队列,将数据存储起来,从而进入下一种循环。 5.你们企业的业务中,并发能达到多少? 6.怎样循环抓取一种网站的 1000 张图片?流程大概是这样找到所有页数----遍历所有的页数----遍历目前页的所有相册(给每个相册建立一...