汇集天下武学——Python笔试题

1、数据表student有id,name,score,city字段，其中name中的名字可有重复，需要消除重复行,请写sql语句

select distinct name from student

2、10个Linux常用命令

ls pwd cd touch rm mkdir tree cp mv cat more grep echo

3、简述mysql和redis区别

redis：内存型非关系数据库，数据保存在内存中，速度快

mysql：关系型数据库，数据保存在磁盘中，检索的话，会有一定的Io操作，访问速度相对慢

4、简述同源策略

同源策略需要同时满足以下三点要求：

1）协议相同

2）域名相同

3）端口相同

http:www.test.com与https:www.test.com 不同源——协议不同

http:www.test.com与http:www.admin.com 不同源——域名不同

http:www.test.com与http:www.test.com:8081 不同源——端口不同

只要不满足其中任意一个要求，就不符合同源策略，就会出现“跨域”

5、简述Django的orm：

ORM，全拼Object-Relation Mapping，意为对象-关系映射

实现了数据模型与数据库的解耦，通过简单的配置就可以轻松更换数据库，

而不需要修改代码只需要面向对象编程,orm操作本质上会根据对接的数据库引擎，

翻译成对应的sql语句,所有使用Django开发的项目无需关心程序底层使用的是MySQL、Oracle、sqlite....，

如果数据库迁移，只需要更换Django的数据库引擎即可

6、zip函数用法：

zip()函数在运算时，会以一个或多个序列（可迭代对象）做为参数，

返回一个元组的列表。同时将这些序列中并排的元素配对。

zip()参数可以接受任何类型的序列，同时也可以有两个以上的参数;当传入参数的长度不同时，

zip能自动以最短序列长度为准进行截取，获得元组。

实例：取一个字符串数据的公公前缀

7、常用sql语句：

show databases;

show tables;

desc 表名;

select * from 表名;

delete from 表名 where id=5;

update students set gender=0,hometown="北京" where id=5

8、MyISAM 与 InnoDB 区别：

a、InnoDB 支持事务，MyISAM 不支持，这一点是非常之重要。

事务是一种高级的处理方式，如在一些列增删改中只要哪个出错还可以回滚还原，

而 MyISAM就不可以了；

b、MyISAM 适合查询以及插入为主的应用，

InnoDB 适合频繁修改以及涉及到安全性较高的应用；

c、InnoDB 支持外键，MyISAM 不支持；

d、对于自增长的字段，InnoDB 中必须包含只有该字段的索引，

但是在 MyISAM表中可以和其他字段一起建立联合索引；

e、清空整个表时，InnoDB 是一行一行的删除，效率非常慢。

MyISAM 则会重建表；

9、简述python垃圾回收机制：

python垃圾回收主要以引用计数为主，标记-清除和分代清除为辅的机制，

其中标记-清除和分代回收主要是为了处理循环引用的难题。

引用计数算法：当有1个变量保存了对象的引用时，此对象的引用计数就会加1

当使用del删除变量指向的对象时，如果对象的引用计数不为1，比如3，

那么此时只会让这个引用计数减1，即变为2，当再次调用del时，变为1，

如果再调用1次del，此时会真的把对象进行删除

10、描述数组、链表、队列、堆栈的区别

数组与链表是数据存储方式的概念，数组在连续的空间中存储数据，

而链表可以在非连续的空间中存储数据;

队列和堆栈是描述数据存取方式的概念，队列是先进先出，而堆栈是后进先出;

队列和堆栈可以用数组来实现，也可以用链表实现。

11、请解释或描述一下Django的架构

对于Django框架遵循MVC设计，并且有一个专有名词：MVT

M全拼为Model，与MVC中的M功能相同，负责数据处理，内嵌了ORM框架

V全拼为View，与MVC中的C功能相同，接收HttpRequest，业务处理，返回HttpResponse

T全拼为Template，与MVC中的V功能相同，负责封装构造要返回的html，内嵌了模板引擎

12、Post请求和get请求区别?

相同：两者都是基于TCP协议工作的。

区别：

1.GET请求一般会被浏览器主动cache，POST不会

（这点很重要，cache刷新页面浏览器不会再请求服务器，

如果设置了max-age的话，减轻服务器负载，提升用户体验）

2.GET请求中传送的参数是有长度限制的（协议规范没有，各个浏览器有，IE最短是2083bytes），

POST没有（但受服务器处理能力影响）。程序内部调用则URL长度不受限制。

3.GET参数是明文保存在URL中，POST参数保存在body中。

13、Session和Cookie的区别？

相同：两者都是用来跟踪浏览器用户身份的会话方式

区别：

1.cookie保存在客户端，session在服务器端

2.保存在客户端就意味着cookie可能被分析并用来实施cookie欺骗，而session不会（也只是相对安全）

3.session存在服务器端就意味着需要消耗服务器性能。

4.cookie的大小会被浏览器限制，一般是4KB（包括key-value），session没有理论限制。

小结：cookie和session两者各有优缺点，实际使用中可将两者结合。

14、创建一个简单tcp服务器需要的流程

1.socket创建一个套接字

2.bind绑定ip和port

3.listen使套接字变为可以被动链接

4.accept等待客户端的链接

5.recv/send接收发送数据

15、scrapy和scrapy-redis有什么区别?为什么选择redis数据库?

1.scrapy是一个Python爬虫框架，爬取效率极高，具有高度定制性，但是不支持分布式。

而scrapy-redis是一套基于redis数据库、运行在scrapy框架之上的组件，

可以让scrapy支持分布式策略，Slaver端共享Master端redis数据库里的item队列、请求队列和请求指纹集合。

2.为什么选择redis数据库，因为redis支持主从同步，而且数据都是缓存在内存中的，

所以基于redis的分布式爬虫，对请求和数据的高频读取效率非常高。

16、可变与不可变类型

1.解释两种类型：

不可变对象 -- 该对象所指向的内存中的值不能被改变。当改变某个变量时候，由于其所指的值不能被改变，

相当于把原来的值复制一份后再改变，这会开辟一个新的地址，变量再指向这个新的地址。

可变对象 -- 该对象所指向的内存中的值可以被改变。变量（准确的说是引用）改变后，实际上是其所指的值

直接发生改变，并没有发生复制行为，也没有开辟新的出地址，通俗点说就是原地改变。

2.两种类型分别有哪些：

不可变：int,float,str,tuple

可变:list,dict,set

17、谈谈浅拷贝与深拷贝

1.python中有值类型与引用类型之分（对应不可变与可变对象）

2.由于值类型的对象在内存中占固定内存空间，所以他们的值保存在栈，按值访问数据

而引用类型的对象大小不固定，所以只将它们的内存地址（它是固定的）存放在栈，由于内存地址指向

实际对象，所有引用类型是按引用访问

3.浅拷贝实现：只复制某个对象的内存地址，新旧变量共享同一内存同一对象。

深拷贝实现：直接复制对象本身，新的对象是独立的，拥有不一样的内存地址，对原对象的修改不影响新对象。

18、__new__和__init__的区别

1. new在init之前执行，前者可决定是否调用后者

2. 在OOP中，实例化遵循创建x，初始化x，返回x（x=实例对象）这么个顺序，new是创建，init是初始化

19、*args and **kwargs如何使用？

*args代表位置参数，它会接收任意多个参数并把这些参数作为元组传递给函数。

**kwargs代表的关键字参数，允许你使用没有事先定义的参数名，kwagrs是一个dict；

另外，位置参数一定要放在关键字参数的前面。

20、线程与进程的区别

从四个方面来分析：

1.调度方不同：进程是操作系统调度的基本单位，而线程是cpu调度的基本单位。

2.开销不同：创建一个进程需要系统单独分配新的地址空间，代价昂贵；而创建新的线程可以直接

使用进程的内存空间，所以进程开销大于线程。

3.通信方式不同：进程间通信一般通过HTTP或RPC方式；而同一进程下的不同线程间是共享全局变量的，通信更简便。

4.健壮性不同：单个进程死掉不会影响其他进程，而单个线程死掉会导致整个进程死掉。

21、谈谈设计模式

1. 解释一下什么是设计模式

简述：是经过总结、优化后的可重用解决方案。它是一种代码设计思想，不同的模式解决不同的问题，

跟编程语言不相关。

2. 你知道哪些设计模式，代码如何实现

a. 工厂模式: 是一个在软件开发中用来创建对象的设计模式。（详解工厂模式：https://www.cnblogs.com/lizhitai/p/4471952.html）

意图：定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。

适用性：

当一个类不知道它所必须创建的对象的类的时候。

当一个类希望由它的子类来指定它所创建的对象的时候。

当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。

b. 单例模式:

意图：保证程序运行时全局环境中只有一个该类的实例

适用性：无论何时何处调用该类，都能使用同一个该类的实例对象的时候。

代码实现：

class Singleton: #一个通用的单例超类，其他类继承即可（也可通过装饰器实现）

def __new__(cls, *args, **kw):

if not hasattr(cls, '_instance'):

cls._instance = object.__new__(cls)

return cls._instance

class SingleSpam(Singleton):

def __init__(self, s):

self.s = s

def __str__(self):

return self.s

c. 装饰模式:

意图：动态地给一个对象添加一些额外的职责。就增加功能来说，装饰模式相比生成子类更为灵活。

适用性：

1. 在不影响其他对象的情况下，以动态、透明的方式给单个对象添加职责。

2. 处理那些可以撤销的功能

d. 迭代器模式:

意图：提供一种方法顺序访问一个聚合对象中各个元素, 而又不需暴露该对象的内部表示。

适用性：

1. 访问一个聚合对象的内容而无需暴露它的内部表示。

2. 支持对聚合对象的多种遍历。

3. 为遍历不同的聚合结构提供一个统一的接口(即, 支持多态迭代)。

代码实现：

# 使用magic方法构建迭代器

class iterable2:

def __init__(self,container):

self._a = container

self._index= -1

def __iter__(self):

return self

def __next__(self):

try:

ret = self._a[self._index+1]

self._index += 1

return ret

except:

raise StopIteration

22、with语句应用场景是？有什么好处？能否简述实现原理

场景：with语句适用于对资源进行访问的场合，确保不管使用过程中是否发生异常都会执行必要的“清理”操作，

释放资源，比如文件使用后自动关闭、线程中锁的自动获取和释放等。

好处：不需要人为释放资源。

原理：with 主要用到一个概念：上下文管理器。

1. 程序运行时，将with后紧跟的对象（一般是个class示例）称作上下文管理器。这个class必须

定义两个方法，__enter__()方法和__exit__()，前者的返回对象赋值给as后面变量。

2. 运行中如果发生了异常，那么将会把异常的类型，值和追踪传递给__exit__()方法。如果__exit__（）

方法返回值为true，那么这个异常将会被抑制，否则这个异常将会被重新抛出。

3. 如果没有发生异常，也会调用__exit__()方法，但是传入的参数为None, None, None。

通常也是在这里放入代码进行如文件流/会话的关闭等操作。

23、TCP与UDP区别；简述三次握手和四次挥手过程

相同：传输层协议，用于报文传输

不同：TCP比UDP可靠，是面向连接的，拥有三次握手和四次挥手、以及超时重传、拥塞控制等机制来保证传输过程可靠，安全。

而UDP传输过程简单，快速高效，且开销小，因为没有建立连接的过程，报文头部仅8字节，TCP头部20字节以及40字节可选项。

但是它没有ACK和序列号机制，无法解决报文丢失和顺序错乱问题。

TCP只能点对点，UDP可以一对一，一对多，多对多。

三次握手：

1. client发送SYN(seq=x)报文 => server（client状态变为SYN_SENT）

2. server发送ACK(seq=x+1)以及SYN(seq=y)报文 =>client （server状态变为SYN_RECV）

3. client发送ACK(seq=y+1) => server （client变为ESTABLISHED，服务器收到后也变为ESTABLISHED）

四次挥手：

1. client发送FIN(seq=x) =>server (client变为FIN_WAIT_1)

2. server先回复ACK(seq=x+1) => client (server只要收到FIN报文就会变为CLOSE_WAIT, client变为FIN_WAIT_2)

3. server发送完剩余的数据报文后，再发送FIN(seq=y) =>client (server变为LAST_CHECK)

4. client发送ACK(seq=y+1) => server (client变为TIME_WAIT)

server收到ACK后直接就关闭closed状态，但client要等2MSL(最大报文生存时间)才会变为closed。

client的状态转变顺序：established-->fin_wait_1->fin_wait_2->time_wait->closed

server的状态转变顺序: established-->close_wait->last_ack->closed

24、说说悲观锁和乐观锁

悲观锁与乐观锁是在资源并发中常见的两种锁设计方式。

1.悲观锁

它的特点是，先获取锁，再做业务操作。即认为在它去操作数据库数据的同时，老是有人来抢，索性直接先获取锁，

谁都抢不了，我先来。在mysql中的实现是“select … for update”语句或者直接“update... where...”，

两者都能获得排它锁，防止别人操作。

悲观锁因为要使用事务，降低了DB并发性能，适合强一致性的场景。

2.乐观锁

它的特点是，先做业务操作，失败后就等着别人释放锁。即认为在它去操作数据库的同时，没有人跟他抢，那就不加锁了。

直接修改业务数据。如果执行修改语句的时候发现资源被别人上了锁，就进入锁等待。等别人释放锁后它再执行。

mysql中如何实现：

给表增加一个字段叫版本号：version，int类型，修改一次加个1。然后通过几行SQL语句实现：

SELECT DATA,version as old_v FROM xxx

rows = UPDATE SET data=data-1,version=version+1 WHERE version=old_v

if rows > 0:

//修改成功

else:

//修改失败，然后重新再走一次此流程，直到成功（但是retry会造成较大的开销）。

乐观锁适用于读多写少，并发冲突较少的场景。

25、链表和顺序表储存时各自有什么优点？

1.顺序表存储

原理：顺序表存储是将数据元素放到一块连续的内存存储空间，

存取效率高，速度快。但是不可以动态增加长度

优点：存取速度高效，通过下标来直接存储

缺点：插入和删除比较慢，不可以增长长度

比如：插入或者删除一个元素时，整个表需要遍历移动元素来重新排一次顺序

2.链表存储

原理：链表存储是在程序运行过程中动态的分配空间，只要存储器还有空间，就不会发生存储溢出问题

优点：插入和删除速度快，保留原有的物理顺序，比如：插入或者删除一个元素时，需要改变指针指向即可

缺点：查找速度慢，因为查找时，需要循环链表访问

26、数据仓库是什么？

概念：

数据仓库是一个面向主题的、集成的、稳定的、反映历史变化的、

随着时间的流逝发生变化的数据集合。它主要支持管理人员的决策分析。

数据仓库收集了企业相关内部和外部各个业务系统数据源、归档文件等一系列历史数据，

最后转化成企业需要的战略决策信息。

特点：

1. 面向主题：根据业务的不同而进行的内容划分；

2. 集成特性：因为不同的业务源数据具有不同的数据特点，当业务源数据进入到数据仓库时，

需要采用统一的编码格式进行数据加载，从而保证数据仓库中数据的唯一性；

3. 非易失性：数据仓库通过保存数据不同历史的各种状态，并不对数据进行任何更新操作。

4. 历史特性：数据保留时间戳字段，记录每个数据在不同时间内的各种状态。

27、使用redis搭建分布式系统时如何处理网络延迟和网络异常？

由于网络异常的存在，分布式系统中请求结果存在“三态”的概念，

即三种状态：“成功”、“失败”、“超时（未知）”

当出现“超时”时可以通过发起读取数据的操作以验证 RPC 是否成功（例如银行系统的做法）

另一种简单的做法是，设计分布式协议时将执行步骤设计为可重试的，即具有所谓的“幂等性”

汇集天下武学——Python笔试题

你可能感兴趣的:(汇集天下武学——Python笔试题)