一、模块、包
什么是模块?
模块实质上就是一个python文件,它是用来组织代码的,意思就是说把python代码写到里面,文件名就是模块的名称,test.py test就是模块名称。
什么是包?
包,package本质就是一个文件夹,和文件夹不一样的是它有一个__init__.py文件,包是从逻辑上来组织模块的,也就是说它是用来存放模块的,如果你想导入其他目录下的模块,那么这个目录必须是一个包才可以导入。
导入模块
1 2 3 4 5 | import module #导入模块 from module import * #导入该模块中的所有方法,慎用 from module import fun as xx_fun #导入指定的方法,然后起别名 from module import fun1,fun2,fun3 #导入模块下的多个方法 import module,实际上就是把该模块的代码赋值给模块名,也就是module.py里面所有的代码,赋值给了module这个变量,如果是from module import fun,就是把module打开,把module里面的fun方法拿过来使用 |
导入模块的本质,就是把python文件拿过来执行一次。
使用包中的模块需要在__init__.py文件中from . import xxx
模块分类:
标准库:python内置的
开源模块:第三方自定义模块:自己写的二、os、sys模块
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 | import os print(os.getcwd())#取当前工作目录 os.chmod("/usr/local",7)#给文件/目录加权限 print(os.chdir("../"))#更改当前目录 print(os.curdir)#当前目录 print(os.pardir)#父目录 print(os.makedirs("/usr/hehe/hehe1"))#递归创建文件夹,父目录不存在时创建父目录 print(os.removedirs("/usr/hehe/hehe1"))#递归删除空目录 print(os.mkdir("test1"))#创建文件夹 print(os.rmdir("test1"))#删除指定的文件夹 print(os.remove("test"))#删除文件 print(os.listdir('.'))#列出一个目录下的所有文件 os.rename("test","test1")#重命名 print(os.stat("len_os.py"))#获取文件信息 print(os.sep)#当前操作系统的路径分隔符 print(os.linesep)#当前操作系统的换行符 print(os.pathsep)#当前系统的环境变量中每个路径的分隔符,linux是:,windows是; print(os.environ)#当前系统的环境变量 print(os.name)#当前系统名称 print(os.path.abspath(__file__))#获取绝对路径 print(os.path.split("/usr/hehe/hehe.txt"))#分割路径和文件名 print(os.path.dirname("/usr/local"))#获取父目录 print(os.path.basename("/usr/local"))#获取最后一级,如果是文件显示文件名,如果是目录显示目录名 print(os.path.exists("/usr/local"))#目录/文件是否存在 print(os.path.isabs("."))#判断是否是绝对路径 print(os.path.isfile("/usr/local"))#判断是否是一个文件 print(os.path.isdir("/usr/local"))#是否是一个路径 print(os.path.join("/root",'hehe','a.sql'))#拼接成一个路径 print(os.path.getatime("len_os.py"))#输出最近访问时间 print(os.path.getmtime("len_os.py"))#输出最近访问时间 |
1 2 3 4 5 6 7 8 | sys.argv 命令行参数List,第一个元素是程序本身路径 sys.exit(n) 退出程序,正常退出时exit(0) sys.version 获取Python解释程序的版本信息 sys.maxint 最大的Int值 sys.path 返回模块的搜索路径,初始化时使用PYTHONPATH环境变量的值 sys.platform 返回操作系统平台名称 sys.stdout.write('please:')#向屏幕输出一句话 val = sys.stdin.readline()[:-1]#获取输入的值 |
三、random模块
1 2 3 4 5 6 7 8 9 10 11 | import random,string print(random.random())#随机浮点数,默认取0-1,不能指定范围 print(random.randint(1,20))#随机整数 print(random.randrange(1,20))#随机产生一个range print(random.choice('x23serw4'))#随机取一个元素 print(random.sample('hello',2))#从序列中随机取几个元素 print(random.uniform(1,9))#随机取浮点数,可以指定范围 x = [1,2,3,4,6,7] random.shuffle(x)#洗牌,打乱顺序,会改变原list的值 print(x) print(string.ascii_letters+string.digits)#所有的数字和字母 |
四、time&datetime模块
time和datetime模块主要用于操作时间
时间有三种表示方式,一种是时间戳、一种是格式化时间、一种是时间元组
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | import datetime,time print(time.timezone)#和标准时间相差的时间,单位是s print(time.time())#获取当前时间戳 print(time.sleep(1))#休息几s print(time.gmtime())#把时间戳转换成时间元组,如果不传的话,默认取标准时区的时间戳 print(time.localtime())#把时间戳转换成时间元组,如果不传的话,默认取当前时区的时间戳 print(time.mktime(time.localtime()))#把时间元组转换成时间戳 print(time.strftime("%y%m%d %H%M%S"))#将时间元组转换成格式化输出的字符串 print(time.strptime("20160204 191919","%Y%m%d %H%M%S"))#将格式化的时间转换成时间元组 print(time.struct_time)#时间元组 print(time.asctime())#时间元转换成格式化时间 print(time.ctime())#时间戳转换成格式化时间 print(datetime.datetime.now())#当然时间格式化输出 print(datetime.datetime.now()+datetime.timedelta(3))#3天后的时间 print(datetime.datetime.now()+datetime.timedelta(-3))#3天前的时间 |
五、shelve模块
shelve模块用来持久化存储数据,比起json来,json只能存储list、字典这样的数据类型,如果是一个函数,一个类的话,就没有办法存储了,但是shelve模块可以,shelve模块是key-value存储的,value是你存储的内容,使用如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 | import shelve d = shelve.open('shelve_test') #打开一个文件 class Test(object): def __init__(self,n): self.n = n t = Test(123) t2 = Test(123334) def func(): print('hello') name = ["alex","rain","test"] d["test"] = name #持久化列表 d["t1"] = t #持久化类 d["t2"] = t2 d["t3"] = func print(d.get("t3"))#获取内容 d.close() |
六、hashlib模块
hashlib模块,主要用于加密相关的操作,在python3的版本里,代替了md5和sha模块,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ,MD5 算法。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 | import hashlib m = hashlib.md5() m.update(b"Hello") m.update(b"It's me") print(m.digest()) m.update(b"It's been a long time since last time we ...") print(m.digest()) #2进制格式hash print(len(m.hexdigest())) #16进制格式hash # ######## md5 ######## hash = hashlib.md5() hash.update('admin') print(hash.hexdigest()) # ######## sha1 ######## hash = hashlib.sha1() hash.update('admin') print(hash.hexdigest()) # ######## sha256 ######## hash = hashlib.sha256() hash.update('admin') print(hash.hexdigest()) # ######## sha384 ######## hash = hashlib.sha384() hash.update('admin') print(hash.hexdigest()) # ######## sha512 ######## hash = hashlib.sha512() hash.update('admin') print(hash.hexdigest()) |
七、configparser模块
configparser模块用来操作配置文件,用于生成和修改常见配置文档,python 3.x 中为configparser,python2中为ConfigParser。
一个常见的配置文件如下:
1 2 3 4 5 6 7 8 9 10 11 12 | [DEFAULT] ServerAliveInterval = 45 Compression = yes CompressionLevel = 9 ForwardX11 = yes [bitbucket.org] User = hg [topsecret.server.com] Port = 50022 ForwardX11 = no |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 | import configparser config = configparser.ConfigParser() config["DEFAULT"] = { 'ServerAliveInterval': '45', 'Compression': 'yes', 'CompressionLevel': '9'} config['bitbucket.org'] = { } config['bitbucket.org']['User'] = 'hg' config['topsecret.server.com'] = { } topsecret = config['topsecret.server.com'] topsecret['Host Port'] = '50022' # mutates the parser topsecret['ForwardX11'] = 'no' # same here config['DEFAULT']['ForwardX11'] = 'yes' with open('example.ini', 'w') as configfile: config.write(configfile) |
下面是一些常用的操作,修改、添加、删除节点、属性
1 2 3 4 5 6 7 8 9 10 11 12 13 | import configparser config = configparser.ConfigParser() config.read('my.cnf') sections = config.sections()#获取所有节点 print(config.get('bitbucket.org','User'))#取对应节点下面key的值 config.add_section('NEW')#增加节点 config.set('NEW','test','true')#增加节点下面对应的熟悉和值 config.set('DEFAULT','niu','222222')#修改节点下的属性 config.write(open("my.cnf","w"))#写入修改后的文件 config.has_option('NEW','test')#节点下是否有对应的属性 config.has_section('NEW')#是否有该节点 config.remove_section('NEW')#删除节点 config.remove_option('NEW','test')#删除节点下面的key |
八、re模块
re模块是正则表达式模块,用来匹配一些特定的字符串。
常用的正则表达式符号
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 | '.' 默认匹配除\n之外的任意一个字符,若指定flag DOTALL,则匹配任意字符,包括换行 '^' 匹配字符开头,若指定flags MULTILINE,这种也可以匹配上(r"^a","\nabc\neee",flags=re.MULTILINE) '$' 匹配字符结尾,或e.search("foo$","bfoo\nsdfsf",flags=re.MULTILINE).group()也可以 '*' 匹配*号前的字符0次或多次,re.findall("ab*","cabb3abcbbac") 结果为['abb', 'ab', 'a'] '+' 匹配前一个字符1次或多次,re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb'] '?' 匹配前一个字符1次或0次 '{m}' 匹配前一个字符m次 '{n,m}' 匹配前一个字符n到m次,re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb'] '|' 匹配|左或|右的字符,re.search("abc|ABC","ABCBabcCD").group() 结果'ABC' '(...)' 分组匹配,re.search("(abc){2}a(123|456)c", "abcabca456c").group() 结果 abcabca456c '\A' 只从字符开头匹配,re.search("\Aabc","alexabc") 是匹配不到的 '\Z' 匹配字符结尾,同$ '\d' 匹配数字0-9 '\D' 匹配非数字 '\w' 匹配[A-Za-z0-9] '\W' 匹配非[A-Za-z0-9] 's' 匹配空白字符、\t、\n、\r , re.search("\s+","ab\tc1\n3").group() 结果 '\t' |
常用的匹配语法
1 2 3 4 5 | re.match 从头开始匹配 re.search 匹配包含 re.findall 把所有匹配到的字符放到以列表中的元素返回 re.splitall 以匹配到的字符当做列表分隔符 re.sub 匹配字符并替换 |