10
2020
08

Python是如何解释语言的?

Python在运行之前不需要对程序进行解释。因此,Python是一种解释型语言。
10
2020
08

Python是通用编程语言吗?

Python能够编写脚本,但从一般意义上讲,它被认为是一种通用编程语言。
28
2020
04

如何通过引用传递变量?

卡python面试题class PassByReference:    def __init__(self):        self.variable = 'Original'        self.change(self.variable)        print(self.variable)    def cha
31
2020
03

Python中pass语句的作用是什么?

pass语句什么也不做,一般作为占位符或者创建占位程序,pass语句不会执行任何操作。
16
2020
03

常见的反爬虫和应对方法?

1)通过Headers反爬虫从用户请求的Headers反爬虫是最常见的反爬虫策略。可以直接在爬虫中添加Headers,将浏览器的User-Agent复制到爬虫的Headers中;或者将Referer值修改为目标网站域名。2)基于用户行为反爬虫通过检测用户行为,例如同一IP短时间内多次访问同一页面,或者同一账户短时间内多次进行相同操作。大多数网站都是前一种情况,对于这种情况,使用IP代理就可以解决。可以专门写一个爬虫,爬取网上公开的代理ip,检测后全部保存起来。有了大量代理ip后可以每请求几次更换
16
2020
03

爬虫过程中验证码怎么处理?

1)scrapy自带2)付费接口
16
2020
03

分布式爬虫主要解决什么问题?

1)ip2)带宽3)cpu4)io
16
2020
03

数据库的优化?

1)优化索引、SQL 语句、分析慢查询;2)优化硬件;采用SSD,使用磁盘队列技术(RAID0,RAID1,RDID5)等;3)采用MySQL 内部自带的表分区技术,把数据分层不同的文件,能够提高磁盘的读取效率;4)选择合适的表引擎,参数上的优化;5)进行架构级别的缓存,静态化和分布式;6)采用更快的存储方式,例如 NoSQL存储经常访问的数据
16
2020
03

写爬虫是用多进程好?还是多线程好? 为什么?

IO密集型代码(文件处理、网络爬虫等),多线程能够有效提升效率(单线程下有IO操作会进行IO等待,造成不必要的时间浪费,而开启多线程能在线程A等待时,自动切换到线程B,可以不浪费CPU的资源,从而能提升程序执行效率)。在实际的数据采集过程中,既考虑网速和响应的问题,也需要考虑自身机器的硬件情况来设置多进程或多线程。
16
2020
03

什么是关联查询,有哪些?

将多个表联合起来进行查询,主要有内连接、左连接、右连接、全连接(外连接)