一、统计txt中英文单词出现的次数
1 import string #处理文本时需要去除跟在单词后的标点。所以用到string模块 12 identity=string.maketrans(' ',' ') #为了配合translate函数必须有一個table来表明将字符串的某字符替换成为另一种字符。虽然本功能中无须替换但还是写了这么个凑数的变量。不知道除translate函数外有没有更方便的去掉特定字符的函数?13 pun_num=string.punctuation+string.digits #指定删除的字符为:标点符号和数字 15 line=line.lower() #将单词中的字母全部转換为小写字母
16 word_list=line.split(' ') #以空格为标志将文本中的一行断开成单词。
?如何将字典按值进行排序呢
说明:代码的运行结果中,英文符号'被转换成了\xe2\x80\x99不了解为什么会这样(应该与编码有关),吔不清楚可以怎样解决
二、将序列中重复的元素去除