Python基础篇(格式化输出,运算符,编码):

格式化输出:

格式:print ( " 内容%s" %(变量))

字符类型:

%s  替换字符串     

%d 替换整体数字   

%f替换浮点型

------------ info of Alex Li -----------                          ------------ info of %s ----------- 

Name : Alex Li                                                      Name : %s

Age : 22                                                                 Age :%d

job : Teacher                                                         job : %s

Hobbie: girl                                                           Hobbie: %s

------------- end -----------------                                   ------------- end -----------------  ame = input("Name:")age = input("Age:"job = input("Job:")hobby = input("Hobbie:")

info = '''
------------ info of %s ----------- #这里的每个%s就是一个占位符,本行的代表 后面拓号里的 name
Name : %s #代表 name
Age : %s #代表 age
job : %s #代表 job
Hobbie: %s #代表 hobbie
------------- end -----------------
''' % (name, name, age, job, hobbie) # 这行的 % 号就是 把前面的字符串 与拓号 后面的 变量 关联起来
print(info)
%s就是代表字符串占位符,除此之外%d是数字的占位符,如果你把age换成%d,也就是代表你只可以使用数字来表示,这时对应的数据
必须是数字(int)类型,否则数据会报错.使用时需要进行类型转换int(str)或者str(int)
我叫xxx, 今年xx岁了,我们已经学习了2%的python基础了 这里的问题出在哪里呢? 没错2%, 在字符串中如果使用了%s这样的占位符.
那么所有的%都将变成占位符. 我们的2%也变成了占 位符. 而"%的"是不存在的, 这里我们需要使用%%来表示字符串中的%.
注意: 如果你的字符串中没有使用过%s,%d站位. 那么不需要考虑这么多. 该%就%.没毛病老铁.
print("我叫%s, 今年22岁了, 学习python2%%了" % '王尼玛')#有占位符
print("我叫王尼玛, 今年22岁, 已经凉凉了100%了") # 没有占位符
基本运算符
计算机可以进行的运算有很多种,可不知加减乘除这么简单,
运算的种类:
算数运算:
  假设 a=10 b=20
  
比较运算:
  假设a=10 b=20
  
逻辑运算:
  
    针对逻辑运算的进一步研究:
    1.在没有()的情况下not优先级高于and,and优先级高于or,既优先级关系为()-->not-->and--or,同一优先级从左往右算
    ()>not>and>or

      1)、6 or 2 > 1      6

    例子:

sentence = input("please sentence:")    #输入句子
screen_width = 80                       #输出屏幕宽度为80
text_width = len(sentence)              #输出内容的宽度
box_width = text_width + 6              #句子两边的宽度
left_margin = (screen_width - box_width) // 2
print()
print(" "* left_margin + "+" + "-" * int(box_width - 2) + "+")
print(" "* left_margin + "|" + " " * text_width + "|")
print(" "* left_margin + "|" +   sentence    + "|")
print(" "* left_margin + "|" + " " * text_width + "|")
print(" "* left_margin + "+" + "-" * int(box_width -2) + "+")
结果:

 


 

赋值运算:
  假设 a=10 b=20
  
成员运算:
身份运算:
位运算:
编码问题
python2解释器在加载.py文件中的代码时,会对内容进行编码(默认ascill),而python3对内容进行编码的默认为utf-8
计算机:
早起计算机是美国发明的.普及率不高,一般只是在美国使用,所以最早的编码结构就是按照美国人的习惯来编码的.
对数字+字母+特殊符号一共也没有多少所以就形成了最早的编码ascill码.直到今天ascill依然深深的影响着我们 
ascill是基于拉丁字母的一套编码系统,主要用于显示现代英语和其他欧语言,其最多只能使用8为表示(一个字节)既2**8 =256,
所以ascill码最多只能表示256个字符
随着计算机的发展. 以及普及率的提高. 流行到欧洲和亚洲. 这时ASCII码就不合适了. 比如: 中文汉字有几万个.
而 ASCII最多也就256个位置. 所以ASCII不行了. 怎么办呢? 这时, 不同的国家就提出了不同的编码用来适用于各自的语言环境.
比如, 中国的GBK, GB2312, BIG5, ISO-8859-1等等. 这时各个国家都可以使用计算机了. GBK, 国标码占用2个字节.
对应ASCII码 GBK直接兼容. 因为计算机底层是用英文写的. 你不支持英文肯定不 行.
而英文已经使用了ASCII码. 所以GBK要兼容ASCII. 这里GBK国标码. 前面的ASCII码部分. 由于使用两个字节.
所以对于ASCII码而言. 前9位都是0
字母A:0100 0001 # ASCII 字母A:0000 0000 0100 0001 # 国标码
国标码的弊端: 只能中国用. 日本就垮了. 所以国标码不满足我们的使用. 这时提出了一个万国码Unicode.
unicode一开始设计是每个字符两个字节. 设计完了. 发现我大中国汉字依然无法进行编码.
只能进行扩充. 扩充 成32位也就是4个字节. 这回够了. 但是. 问题来了. 中国字9万多.
而unicode可以表示40多亿. 根本用不了. 太浪 费了. 于是乎, 就提出了新的UTF编码.可变长度编码 UTF-8: 每个字符最少占8位.
每个字符占用的字节数不定.根据文字内容进行具体编码. 比如. 英文. 就一个字节就 够了. 汉字占3个字节. 这时即满足了中文.
也满足了节约. 也是目前使用频率最高的一种编码 UTF-16: 每个字符最少占16位. GBK: 每个字符占2个字节, 16位
单位转换:
8bit = 1byte
1024byte = 1kb
1024kb = 1mb
1024mb = 1g
1024gb = 1t
1024gt = 1pt
1024pt = 1et
1024et = 1zt
1024zt = 1yt
1024yt = 1nt
1024nt = 1dt
常用到tb就够了
1.python2中默认使用的是ASCLL码,里边有英文,大写字母,小写字母,数字,一些特殊字符,没有中文.
  8个01代码,8个bit,1个byte
2.GBK:中文国标码, 里边包含了ASCII编码和中文常用编码. 16个bit, 2个byte
3.UNICODE: 万国码, 里面包含了全世界所有国家文字的编码. 32个bit, 4个byte, 包含了 ASCII
4.UTF-8: 可变长度的万国码. 是unicode的一种实现. 最小字符占8位
  1.英文: 8bit 1byte
  2.欧洲⽂字:16bit 2byte
  3.中⽂:24bit 3byte
综上, 除了ASCII码以外, 其他信息不能直接转换
在python3的内存中. 在程序运序阶段. 使用的是unicode编码. 因为unicode是万国码. 什么内容都可以进行显示
那么在数据传输和存储的时候由于unicode比较浪费空间和资源. 需要把 unicode转存成UTF-8或者GBK进⾏存储. 怎么转换呢.
在python中可以把文字信息进行编码. 编码之后的内容就可以进行传输了. 编码之后的数据是bytes类型的数据.其实啊.
还是原来的 数据只是经过编码之后表现形式发生了改变而已.
byte的表现形式:
  1.英文 b'alex' 英文的表现形式和字符串没什么两样
  2.中文 b'\xe4\xb8\xad' 这是一个汉字的UTF-8的bytes表现形式
字符串在传输时转化成bytes=> encode(字符集)来完成
s = "alex"
print(s.encode("utf-8")) # 将字符串编码成UTF-8
print(s.encode("GBK")) # 将字符串编码成GBK
结果:
b'alex'
b'alex'
s = ""
print(s.encode("UTF-8")) # 中文编码成UTF-8
print(s.encode("GBK")) # 中文编码成GBK
结果:
b'\xe4\xb8\xad'
b'\xd6\xd0'

记住: 英文编码之后的结果和源字符串一致. 中文编码之后的结果根据编码的不同. 编码结果 也不同. 我们能看到. 一个中文的UTF-8编码是3个字节.

一个GBK的中文编码是2个字节.