1)、关键词分析(也叫关键词定位):这是进行SEO优化最重要的一环,关键词分析包括:关键词关注量分析、竞争对手分析、关键词与网站相关性分析、关键词布置、关键词排名预测。
2)、网站架构分析:网站结构符合搜索引擎的爬虫喜好则有利于SEO优化。网站架构分析包括:剔除网站架构不良设计、实现树状目录结构、网站导航与链接优化,网站设计的语言最好采好DIV+CSS样式,代码很有层次和简洁。
3)、与搜索引擎对话:向各大搜索引擎登陆入口提交尚未收录站点。在搜索引擎看SEO的效果,通过site:你的域名,知道站点的收录和更新情况。通过 domain:你的域名或者link:你的域名,知道站点的反向链接情况。更好的实现与搜索引擎对话,建议采用Google网站管理员工具。
4)、网站目录和页面优化:SEO不止是让网站首页在搜索引擎有好的排名,更重要的是让网站的每个页面都带来流量,长尾关键词采用内页优化。
5)、内容发布和链接布置:搜索引擎喜欢有规律的网站内容更新,所以合理安排网站内容发布日程,每天更新的时间段,发布文章内容的原创性高,是SEO优化的重要技巧之一。链接布置则把整个网站有机地串联起来,让搜索引擎明白每个网页的重要性和关键词,实施的参考是第一点的关键词布置。友情链接和站外链链的战役也是这个时候展开。
6)、高质量的友情链接:建立高质量的友情链接,对于SEO优化来说,可以提高网站PR值以及网站的更新率,都是非常关键性的问题。
7)、建立网站地图SiteMap:根据自己的网站结构,制作网站地图,让你的网站对搜索引擎更加友好化。让搜索引擎能过SiteMap就可以访问整个站点上的所有网页和栏目。
8)、网站流量分析:网站流量分析从SEO结果上指导下一步的SEO策略,同时对网站的用户体验优化也有指导意义。
可以通过requests库re库进行淘宝商品爬虫爬取import requests
import re
def getHTMLText(url):
try:
r= requests.get(url,timeout=30)
r.raise_for_status()
r.encoding = r.apparent_encoding
return r.text
except:
return ""
def parsePage(ilt,html):
try:
plt = re.findall(r'\"view_price\":\"[\d+\.]*\"',html)
tlt = re.findall(r'\"raw_title\"\:\".*?\"',html)
for i in range(len(plt)):
price = eval(plt[i].split(':')[1])
title = eval(tlt[i].split(':')[1])
ilt.append([price,title])
except:
print("F")
def printGoodsList(ilt):
tplt = "{:4}\t{:8}\t{:16}"
print(tplt.format("序号","价格","商品名称"))
count = 0
for g in ilt:
count = count +1
print(tplt.format(count,g[0],g[1]))
def main():
goods = '书包'
depth = 2
start_url = "https://s.taobao.com/search?q="+ goods
infoList = []
for i in range(depth):
try:
url = start_url +'&s='+str(44*i)
html = getHTMLText(url)
parsePage(infoList,html)
except:
continue
printGoodsList(infoList)
main()
这段代码在过去是可以爬取淘宝商品信息,但是因为淘宝的反扒技术升级,便不能让你大摇大摆地进出自如了。
此外也可以借助采集实现采集
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)