想做一个能把文章中的快速记忆英语单词的方法按频率排列的东西,需要怎么编程

当前位置: →
→ 一天一个shell实例1文本中n个出现频率最高的单词转
一天一个shell实例1文本中n个出现频率最高的单词转
& 作者及来源: 幻星宇 - 博客园 &
&收藏到→_→:
摘要: 一天一个shell实例(1)文本中n个出现频率最高的单词(转)
"一天一个shell实例1文本中n个出现频率最高的单词转"::
写一个文本处理程序,查找文本中n个出现频率最高的单词,输出的结果需要显示这些单词出现的次数,并按照次数从大到小排序。
把问题分成六个步骤:
1,将文本以一行一个单词的形式显示出来
2,将大写字母转换成小写
3,对单词进行排序
4,对排序好的单词列表统计每个单词出现的次数
5,按照出现的次数排序
6,显示单词列表的前n行
脚本的代码如下:
#topn.sh脚本#!/bin/bashend=$1&&&& #1cat&$2&|&& && #2tr&-cs&"[a-z][a-z]"&"[\012*]"&|&&&&& #3tr&a-z&a-z&|&&&&& #4sort&|&& && #5uniq&-c&|&&&&& #6sort&-k1nr&-k2&|&& & & #7head&-n"$end"&&&&&& #8
#1:$1为第一个参数,表示输出频率最高的行数
#2:$2为第二个参数,表示目标文本,使用cat把目标文本输入管道,|为管道符
#3:tr命令的-c选项用于选定不在&[a-z][a-z]&字符集内的字符,tr命令将选定的字符转换成换行符,\012是换行符的八进制码,*表示将换行符任意扩展,使其等于被替换的字符集个数,这样此文来自: 马开东博客
转载请注明出处 网址:
就将所有非字母的符号转换为换行符,从而将文本文件以一行一个单词的形式显示出来。-s删除所有重复出现的字符序列,只保留一个。最后把得到的结果输入管道。
#4:tr把大写字母转化成小写字母
#5:把分好的单词进行排序
#6:uniq对排序好的单词列表统计每个单词出现的次数,并删除相邻重复行,-c 在输出行前面加上每行在输入文件中出现的次数。 这样就得到了出现的频率及其对应的单词。
#7:用sort按照出现的频率从大大小排序,频率相同的按照字母排序。-k1表示按照第一域进行排序,-k2为按照第二域进行排序,先按照第一域排序如果第一域相等再按照第二域排序,-n表示数字,-r表示从大到小排序
#8:head 输出前n行
输出结果:
root@lnotebook-pc:/home/lwx/myshelltest#&./topn.sh&5&test&.txt13&qwe12&qw11&eqw8&sdf7&we&
搜索此文相关文章:此文来自: 马开东博客
网址: 站长QQ
一天一个shell实例1文本中n个出现频率最高的单词转_博客园相关文章
博客园_总排行榜
博客园_最新
博客园_月排行榜
博客园_周排行榜
博客园_日排行榜已解决问题
一篇文章的关键词可以设几个呢?出现频率应该如何?
浏览次数:1021
用手机阿里扫一扫
最满意答案
我们先不管文章的关键词,先关心一下这几个细节:
1】你所写的文章准备放在哪些平台,权重如何?
2】你的文章准备给什么样的人来看,这个就是受众
3】你发布上去的周期是多长?
4】你写文章的目的何在?
5】文章的类型是什么?
确定好以上的内容之后再来判断文章的关键词,个人的建议是:
1】一篇文章可以承载1-3个关键词【同类型】
2】文章的字数在600-1000个文字
3】现在的SEO没有那么讲究出现频率,以前的关键词密度是2-8%,目前我自己所写的文章一般有出现2-3次就行了!
答案创立者
以企业身份回答&
软文的关键词可以尝试在篇首,篇中及篇尾中出现,如果是长篇软件在3000字以上的,可以设置8个哈!
正在进行的活动
生意经不允许发广告,违者直接删除
复制问题或回答,一经发现,拉黑7天
快速解决你的电商难题
店铺优化排查提升2倍流量
擅长&nbsp 店铺优化
您可能有同感的问题
扫一扫用手机阿里看生意经
问题排行榜
当前问题的答案已经被保护,只有知县(三级)以上的用户可以编辑!写下您的建议,管理员会及时与您联络!
server is ok涓婁紶鍙戝竷
禄 鍗曡瘝璇嶉?缁熻?绋嬪簭,缁撴灉浣挎枃绔犱腑鐨勫崟璇嶆寜瀛楀吀椤哄簭鎺掑垪锛屼笖璁$畻鍑烘瘡涓?崟璇嶅嚭鐜扮殑棰戠巼锛堝嵆娆℃暟锛}

我要回帖

更多关于 快速记忆英语单词的方法 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信