python自然语言处理——1.4 回到python:决策和控制

微信公众号:数据运营人
本系列为博主的读书学习笔记,如需转载请注明出处。

第一章 语言处理与python

1.4 回到python:决策和控制条件对每个元素进行操作嵌套代码块条件循环

1.4 回到python:决策和控制

条件
  • 数值比较运算符
运算符 关系
< 小于
<= 小于等于
== 等于(注意是两个“=”号而不是一个)
!= 不等于
> 大于
>= 大于等于

列表生成式和关系运算符

print(sent7)
print([w for w in sent7 if len(w)<4])
print([w for w in sent7 if len(w)<=4])
print([w for w in sent7 if len(w)==4])
print([w for w in sent7 if len(w)!=4])

返回结果:

  • 一些词比较运算符
函数 含义
s.startswith(t) 测试 s是否以t开头
s.endswith(t) 测试 s是否以t结尾
t in s 测试 s是否包含t
s.islower() 测试 s中所有字符是否都是小写字母
s.isupper() 测试 s中所有字符是否都是大写字母
s.isalpha() 测试 s中所有字符是否都是字母
s.isalnum() 测试 s中所有字符是否都是字母或数字
s.isdigit() 测试 s中所有字符是否都是数字
s.istitle() 测试 s是否首字母大写( s中所有的词都首字母大写)

列表生成式和字符串比较运算符

print(sorted([w for w in set(text1) if w.endswith('ableness')]))
print(sorted([term for term in set(text4) if 'gnt'in term]))
print(sorted([item for item in set(text6)if item.istitle()]))
print(sorted([item for item in set(sent7)if item.isdigit()]))

列表生成式多条件

print(sorted([w for w in set(text7)if '-' in w and 'index' in w]))
print(sorted([wd for wd in set(text3) if wd.istitle() and len(wd)> 10]))
print(sorted([w for w in set(sent7) if not w.islower()]))
print(sorted([t for t in set(text2) if 'cie' in t or 'cei' in t]))
对每个元素进行操作
print([len(w) for w in text1])
print([w.upper() for w in text1])
print(len(text1))
print(len(set(text1)))
print(set([word.lower() for word in text1]))
print(len(set([word.lower() for word in text1 if word.isalpha()])))
嵌套代码块
ord = 'cat'
if len(word) < 5:
    print ('word length is less than 5')
else:
    print('word length is more than 5')
条件循环
# if 条件
sent1 = ['Call','me','Ishmael','.']
for i in sent1:
    if i.endswith('l'):
        print(i)
# if…elif…else条件
for token in sent1:
    if token.islower():
        print (token, 'is a lowercase word')
    elif token.istitle():
        print (token, 'is a titlecase word')
    else:
        print (token, 'is punctuation')
posted @ 2018-11-28 22:18  ly803744  阅读(272)  评论(0编辑  收藏  举报