第三次作业

学号 2017####7088
姓名 安家民

def process_file(dst): # 读文件到缓冲区
try: # 打开文件
f = open(dst, 'r')
except IOError as s:
print(s)
return None
try: # 读文件到缓冲区
bvffer = f.read()
except:
print("Read File Error!")第三次作业_第1张图片

    return None
f.close()
return bvffer

此函数为打开文件并读取到缓冲区的函数
def process_buffer(bvffer):
if bvffer:
word_freq = {}
# 下面添加处理缓冲区 bvffer代码,统计每个单词的频率,存放在字典word_freq
bvffer = bvffer.lower()
for ch in '“‘!;,.?”':
bvffer = bvffer.lower().replace(ch, " ") #将所有字母转换成小写,便于统计
words = bvffer.strip().split() #strip消除空白符,split以空格作为单词分界
for word in words:
word_freq[word] = word_freq.get(word, 0)+1 #读取到的单词存放到字典
return word_freq

此函数为在缓冲区内 处理文章中空格以及大小写等问题 并将读取的单词放置到字典当中的函数
def output_result(word_freq):
if word_freq:
sorted_word_freq = sorted(word_freq.items(), key=lambda v: v[1], reverse=True)
for item in sorted_word_freq[:10]: # 输出 Top 10 的单词
print(item[0], item[1])

此函数是最后统计结果 并且输出前十单词的函数
if name == "main":
dst = "Gone_with_the_wind.txt"
bvffer = process_file(dst)
word_freq = process_buffer(bvffer)
output_result(word_freq)
Main执行以上函数
以下为运行程序情况 以及效能分析
第三次作业_第2张图片
第三次作业_第3张图片
第三次作业_第4张图片
第三次作业_第5张图片
第三次作业_第6张图片

你可能感兴趣的:(第三次作业)