您的当前位置:首页->链接知识-> 文章预览
链接知识

百度站长工具之链接分析如何定位网站的SEO题目?

标签:百度,站长,长工,工具,链接,分析,如何,定位,网站  2016/5/18 11:44:37  预览53474

站长之家(Chinaz.com)注:网站链接分析,源于对Web结构中超链接的多维分析,是网站优化运营中不可缺少题目诊断方法。百度站长平台也推出其官方的链接分析工具。那么,我们该如何行使好百度站长工具的链接分析功能路名牌生产厂家,来定位网站可能存在的SEO题目呢?

1、本文的重要内容有哪些呢?

(1)查找是否有黑链出现——从日志分析,百度蜘蛛抓取了网站的哪些预期外的页面,是否存在黑链。(这个可能要先卖个关子,由于这又是个大工程啦,本期专题会提到一些)

(2)百度站长工具外链分析——查看是否有垃圾外链、黑链等,以及链向的站内什么地方,如何处理。(本期里面也有所涉及)

(3)百度站长工具链接分析——三大死链(内链死链、链出死链、链入死链),批量下载数据,合并数据,excel操作,按逻辑分类,定位题目,处理题目。(定位和处理,材料不够,由于好多已经处理过了,没有材料了= =|)

(4)从分析这些数据,得到的与SEO结果相干的其他信息(垃圾搜索引擎、垃圾外链带来的无用抓取,虚耗资源配额,如何拒绝。)

(5)如何主动化地使用shell脚本,定位到被百度蜘蛛抓取到的死链,并进行复查,然后将确定为死链的URL进行主动化提交。(本期专题内容太多,留作下期专题用)

(6)分析工具介绍(firefox设置,插件,excel,windows饬令提醒符批处理)

2、本文中重要使用到的工具

(只是结合例子中,假如有其他相似功能的工具,请结合自身风俗使用即可)

【欣赏器】火狐(Firefox)欣赏器,版本无所谓

【插件】:Launch Clipboard

功能:一键打开剪切板中存在的URL。(细致URL中只能有英文数字标点浙江人事考试网首页,假如有中文可能无法被识别)。快捷键:alt + shift +K(先复制好单个或者多个URL)

设置:打开选项设置,选择好下载文件主动保存的位置(我这里选择了桌面,你也可以单独丰硕一个文件夹,好对批量下载的文件进行归类)

【表格处理】:Microsoft Office 2013 Excel

【文本处理】:Notepad++

【批量处理】:Windows自带饬令提醒符

一、我们可以先看一下外链分析。

分析外链数据的重要目的是,找出垃圾外链,自动去封堵垃圾外链可能对网站造成的恶劣影响。最终目标:

1、找到垃圾外链的域名,进行防盗链处理(针对来源为垃圾域名的,直接返回404状况码);

2、处理站内可能存在题目的页面。

这里,我会重点讲解第一点;第二点比较简单,我会讲解得比较粗略。

1、定位出垃圾域名。

图注:可以看到这是一个显明不正常的趋势图

我们可以下载外链数据,来进行初步分析。

图注:下载得到的表格文件(csv逗号分隔符)

但是如许一份原始数据,是很难进行分析的。因此我们必要按照肯定逻辑对其进行分析——就是按照【被链接的网页url】进行分类。

首先,我们可以快速欣赏一下,进行直观判断,这些页面大部分是什么页面呢?

针对我们网站的情况来说,外链数据分为两类,正常外链与垃圾外链。

而垃圾外链又分为两种:站内搜索效果页面(垃圾搜索词)以及被黑客入侵植入的黑链(已经处理为死链)。

我们进行数据处理的目的有两个:识别出哪些是正常外链,哪些是垃圾外链,并根据垃圾外链的相干数据,进行一些处理百度排名,保护好网站;并且必要使被垃圾链接指向的页面,不被搜索引擎抓取(虚耗抓取资源配额)以及被收录/索引(保证网站词库不受污染,不为网站带来形象与关键词方面的负面影响)。

第一步,筛选出网站的搜索效果页面

图注:筛选数据、复制到新的sheet中,删除原始sheet中的筛选数据,来分类数据

还有几类搜索链接格式,都以雷同体例进行处理。

然后把原始sheet中剩下的数据进行去重(空白行),得到剩余的链接信息。

图注:对剩余数据进行简单的去重处理。

然后,我们必要对黑链进行筛选。黑链的数据,一样平常必要先从网站日志中分析得到(如许是最周全的成都人事考试网首页,为了保证服从,会必要使用到shell脚原本主动运行,但是涉及篇幅过多,我将在以后的专题中进行讲解)。

当然也可以对表格中【被链接的网页url】这一列按照顺序排序后,挨着分析得到(本身去打开,同时黑客会使用一些特别手段,妨碍我们去识别真正的会被搜索引擎识别到的垃圾内容,最常见的情况就是,使用js跳转。如许我们通过欣赏器访问时,会看到完全不一样的内容,而搜索引擎抓取时,则下载到了垃圾内容。)

这时,我们必要使用一款firefox插件【No Script】,旨在屏蔽网站上的js,看到与搜索引擎类似的内容。

图注:屏蔽欣赏器中java script的插件

另外还有一种不是很靠谱的甄选方法,在搜索引擎里面去搜:【site:域名 博采】之类的关键词,把不吻合网站预期的关键词拿去搜,就可以得到许多链接了。(这里必要使用一些方法,把链接全都批量导出,在往后的专题中,我会继承讲解的)

注:相干网站建设技巧阅读请移步到建站教程频道。