wc –c #查看
less #查看文件中的内容格式,按“q”退出
cat #打开文件,也可以同时打开多个文件,中间用 “|”命令分隔。
Cat 1.txt 2.txt #合并打开文件
Cat *.txt #打开所有文本文件
grep #文本搜索命令,把符合搜索条件的行打印出来。
Grep –参数文件名 #grep后面一半跟参数和文件名使用,也支持正则表达式。
-I #不区分大小写
-v #显示不符合搜索条件的所有行
-c #显示符合搜索条件的行数
Head #用来提取数据的前几行
Tail #用来提取数据的后几行
Head -10005 1.txt|tail -10000>>2.txt #head,tail的组合用法,提取1.txt文件中10005行到10000的数据,并写入2.txt文件中。
Wc #用来统计文本大小、字符多少及行数等。
Wc –c #统计文本的字节数。
Wc –m #统计文本的字符数
Wc –l #统计文本的行数
Sort #对文件中的数据排序
Sort –n #按数字的值进行排序,即“a-z,0-9”的顺序。
Sort –r #按数字的值反向排序,即“9-0,z-a”的顺序。
Uniq #去重命令,只能对已经排序的文档,才能起到去重计数的作用。
Uniq –c #去重并显示重复的次数
Awk #不需要对数据排序即可去重,当对源数据排序有特定需求时,可以选择awk来进行去重。
Split #文件分割命令,带参数使用。
Split –l 行数 #按行数切割
Split –b #按字节切割文件,如出现切割乱码情况,可使用-c保持每行的完整性。
寄生虫
是利用搜索引擎算法的漏洞,快速取得关键词排名,常见的传统黑帽seo手法有:垃圾链接,隐藏网页,刷IP流量,桥页,关键词堆砌,刷下拉,JS框架,站群等等。在新的2015年中百度加大对作弊性的SEO惩罚,于是乎道高一尺魔高一丈,镜像类的站群和繁殖程序火起来了,镜像高权重网站,或者SEO架构好的网站镜像内页繁殖程序等
在这期间还有一种就是劫持,出现ASP,PHP,HTML脚本劫持,反向代理劫持等,反向代理劫持案例典型的就是当年的李毅吧,脚本劫持原理就是调用写好的脚本,利用政府站或高权重站,大家都懂得,由于国家现在的机制,政府站是比较有权威性。给搜索引擎看的目标关键词,用户搜索的是看到的政府站。用JS判断用户搜索关键词进行跳转目标站。劫持太疯狂,百度后来还是出现了安全联盟拦截。劫持发展到现在。百度基本上对算法漏洞的弥补,基本上是没有什么大的作用。
shell
在seo方面常用shell命令,这里的shell是cygwin在windows平台上运行的Lunix模拟环境。
wc –c #查看
less #查看文件中的内容格式,按“q”退出
cat #打开文件,也可以同时打开多个文件,中间用 “|”命令分隔。
Cat 1.txt 2.txt #合并打开文件
Cat *.txt #打开所有文本文件
grep #文本搜索命令,把符合搜索条件的行打印出来。
Grep –参数文件名 #grep后面一半跟参数和文件名使用,也支持正则表达式。
-I #不区分大小写
-v #显示不符合搜索条件的所有行
-c #显示符合搜索条件的行数
Head #用来提取数据的前几行
Tail #用来提取数据的后几行
Head -10005 1.txt|tail -10000>>2.txt #head,tail的组合用法,提取1.txt文件中10005行到10000的数据,并写入2.txt文件中。
Wc #用来统计文本大小、字符多少及行数等。
Wc –c #统计文本的字节数。
Wc –m #统计文本的字符数
Wc –l #统计文本的行数
Sort #对文件中的数据排序
Sort –n #按数字的值进行排序,即“a-z,0-9”的顺序。
Sort –r #按数字的值反向排序,即“9-0,z-a”的顺序。
Uniq #去重命令,只能对已经排序的文档,才能起到去重计数的作用。
Uniq –c #去重并显示重复的次数
Awk #不需要对数据排序即可去重,当对源数据排序有特定需求时,可以选择awk来进行去重。
Split #文件分割命令,带参数使用。
Split –l 行数 #按行数切割
Split –b #按字节切割文件,如出现切割乱码情况,可使用-c保持每行的完整性。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)