% r8 L/ B0 A' X* z
百度互联网创业俱乐部搜
' P% b+ T2 m7 L索引擎优化指南
\& R( J8 R# [- e版本号:V1.0 ~: P M) s6 o- G0 P! S) w/ f7 r
@ Baidu 2010 2 g- o4 s; b: |; j+ Z3 U
2 百度搜索引擎优化指南 2 x# x Z$ ?% Q x E
/ B4 k1 b( N* O1 ^$ D 0 q0 P& q% n. z; o
/ d$ _ {( h) o% ~6 s/ K0 R6 {! c
前言
Q: O( i/ [/ Q/ L. hSEO(Search engine optimization,搜索引擎优化),指为了提升网页在搜索引擎 * b! k. G% F% T" W& s8 Q% ~
自然搜索结果中(非商业性推广结果)的收录数量以及排序位置而做的优化行为,这一行为
/ ?. U; Q" Y7 d/ r4 k* J的目的,是为了从搜索引擎中获得更多的免费流量,以及更好的展现形象。而SEM(Search
: |( p9 X/ @& ]' x3 o5 m* T/ Kengine marketing,搜索引擎营销),则既包括了SEO,也包括了付费的商业推广优化。
v0 V. N$ q' u毋庸讳言,SEO 自从1997 年左右出现以来,就和搜索引擎处于某种对立状态。这种 8 M9 h* T- K. j. V, k, P4 u9 E
对立源于两方面:
0 E: Y* ]9 N6 ]- C一方面,大量SEO 行为只考虑了如何获得更多的“免费”流量,至于多的这些流量是否
7 v [. e4 A# q- ~$ d符合搜索用户价值,则不在考虑范围之内。这种SEO 被称为“黑帽”,历来受到搜索引擎的 / K% z5 b1 X; V9 ]
严厉打击。
K! G. J* o( w4 |: w5 N4 t1 [另一方面,SEO 的目的是为了获取更多的“免费”流量,这和搜索引擎的商业推广是对立 % V* x* q. C9 g( i, b( P
的。所以很多SEO 的从业者,包括相当多的搜索引擎从业者,从心底里认为,两者的利益
& }+ h! p2 `1 @3 t4 i I" `就是不可调和的。
1 Y& s9 z5 j$ _( f1 B9 v但如果从更加长远的角度来看,搜索引擎和SEO 从业者的利益,实际是有高度一致的
1 y/ \6 a8 h; {1 U地方的: - ~* X+ N4 \+ o7 K
首先,搜索引擎的搜索质量改善,很大程度上受到资源形态的影响。比如很多优质资源,
2 X; \& L( {" J是用Flash 或者Ajax 做的,搜索引擎就无法很好的爬取和索引。搜索引擎无法独立承担起
( j. q, m0 B* K/ L0 |. B这个引导教育职责,有了SEO 参与其中,这些优质资源就可以更好的发挥其检索效果,改
& b7 i) {& P7 z善用户搜索体验。 ' b& x7 c- R( B3 B0 a
其次,SEO 从业者也是搜索引擎商业价值很好的布道者。尤其对于中国这样的新兴市
; Z3 C5 W$ g; d: n! k场,传统的中小企业对于如何触网,如何做互联网营销,并无多少经验。SEO 在其中可以
* B# y6 I& M5 t3 _& v扮演非常重要的角色。而这种布道,对于搜索引擎产业价值的拓展,是很有好处的。 ( E p4 A+ v! v3 z- ~% K% K
基于以上原因,我们需要重新审视搜索引擎和SEO 之间的关系。两者宜建立起一种更
2 G2 P& [/ U& r* [; Y0 Q+ Q& D) \& _加良性的共生关系,驱逐劣币,提携良币,以使互联网生态圈得到更加健康有序的发展。百 - a8 F9 |9 q. u& t; X8 @" a3 I+ Q7 F
度作为中文搜索领域的领导者,有责任和义务来推进这个事情。这也是本文档发布的初衷。 - x; W! Z9 C+ z! R
我们先来看一下过去的问题所在。
7 P9 _& U' B8 o! u(1) 黑帽SEO 大行其道,占据了SEO 主流话语权
: b& z3 X9 y( \. K3 i黑帽SEO 行为,通常就是一般所谓的“搜索引擎作弊”。利用和放大搜索引擎的策略缺 # M$ T: Y3 O: ?. b6 r; m8 r6 X
陷(实际上完美的系统是不存在的)获取更多用户访问量。而这种更多的访问量,是以伤害
5 j6 R: t8 `0 u" D* B+ m3 百度搜索引擎优化指南 + I& ^3 `" D7 z* I1 i
用户体验为代价的,而这会危及一个搜索引擎的生存基础。所以,面对这样的行为,如果短
9 J9 h. N8 p! M% y& d期内无法修补系统,搜索引擎也会通过一些临时策略进行遏制以免事态的失控。在作弊领 8 j& J. t3 J( C5 w! p+ q& }
域,破窗效应是非常明显的。
* A q. E1 x5 x% i很多人会说,整天说作弊作弊,到底哪些行为是作弊?这是无法穷尽的。互联网在动态
8 d' a P5 J! V& J3 `的发展,搜索引擎也在动态的发展,作弊行为自然也是在动态的发展。最基本的界定法则, + P U# \& E5 L \4 H, `& T
就是这个行为的泛滥,是否会影响搜索系统,最终伤害到用户的搜索体验。 1 Z* n# r: M# g- F! C
对黑帽SEO 行为放任不管,不仅会造成搜索引擎质量的下降,还会恶化互联网生态环 2 a4 y& D. W+ p% O( Y
境,并使得良性的建站积极性受到打压,最终形成劣币驱逐良币的恶劣后果。在过去,黑帽 ! q, X' B) p1 M
SEO 者面对惩罚,振振有词,甚至将搜索引擎告上法庭,这种状况,严重影响了正常的舆
5 g) B7 z8 A4 D7 T4 E8 O- h& C论氛围。这是我们必须要去扭转的。 ) I( d2 W6 |/ A: V
总之,搜索引擎和黑帽SEO 行为之间的矛盾,是不可调和的;过去如此,现在如此,
2 o& P: y9 e5 B2 A6 W将来也一定如此。打击黑帽SEO,会始终是搜索引擎质量控制的关键环节之一。而营造黑 6 X8 I" i7 l1 \! P/ u* I+ n& @
帽SEO 者“老鼠过街,人人喊打”的舆论氛围,也是我们需要努力的目标。
! S+ j5 K+ u i$ W, N- _2 G' w3 H(2) 白帽SEO 行为得到的指引不够清晰 9 G8 |/ L: c7 r; J
所谓白帽SEO,就是能起到改良和规范网站设计,使之对搜索引擎和用户更加友好, Z; S+ p5 Q- J8 ~
并从中获取更多合理流量的优化行为。但过去的问题在于,我们过去较少的界定,什么样的 $ R+ w% @1 ?% g* w7 [8 ~* V
行为是推荐的。这导致很多白帽优化心存顾虑。 2 o' u; u4 q" P6 y/ C: p) j: q
正是鉴于上述问题,百度决定提供更加公开化的白帽SEO 指南,营造更好的舆论氛围, ( b9 z- P; b! c+ H, r
以使SEO 行业,有更加良性的发展。
$ m D& j, d. P/ Z2 O) B4 {: H需要指出的是,我们所颁布的SEO 指南,虽然听取了众多站长的意见和建议,但离完 : x( ^- m& z3 }( {
美仍有相当距离。所以,我们会通过“百度站长俱乐部”这个渠道, 收集更多的建设性意见,
* q, X4 p/ d; Q) G来不断的完善这一指南。 " b" F+ J, m+ j
4 百度搜索引擎优化指南 - J" c1 h$ {4 |
目录 % I: |9 d! s1 Q! b$ t' v- _* S
前言.. 2
1 W4 Q. K$ ~2 o% Q0 |; s( [目录.. 4
! \# v( W# X( v* s" x) o2 Z% h: z1 前期准备.................................................................................................................... 5
4 C; d8 E; f: F$ o* m1.1 域名注册.................................................................................................................... 5
7 d" K: W7 ?1 f7 p. ?( S4 d9 r1.2 服务器、空间租用..................................................................................................... 5 ' T$ w; f9 I' W, q) p
2 面向搜索引擎的网站建设.......................................................................................... 6
2 o9 `. V+ J3 u7 `3 H( F; p2.1 良好收录.................................................................................................................... 6
# t1 ^( b8 R# y' R1 K" R& p0 ? T" B2.2 良好排序.................................................................................................................. 11 3 Y4 k9 ~5 }- H/ R1 z
2.3 良好展现.................................................................................................................. 13 6 N6 N# E# v" n p, U. i$ L( T
3 网站运营.................................................................................................................. 15
# e; I2 W ]- q3.1 目标=转化率............................................................................................................ 15 8 n4 F# D6 K' P4 O
3.2 搜索引擎流量分析................................................................................................... 15 4 o2 l5 j3 U4 x* g
3.3 网站信任度.............................................................................................................. 16 % u% H9 B) D: o r# t. C; \4 L
3.4 不断强化品牌概念................................................................................................... 16
; L% W; g2 @2 q7 ^2 Q4 作弊与惩罚.............................................................................................................. 16 & L8 \$ I S7 r5 [: W8 F6 i
4.1 百度如何定义作弊................................................................................................... 16
# E) h; L% Q& I6 }! j. N4.2 作弊会受到怎样的惩罚............................................................................................ 18 ~; Y' ?) d, r: j3 S1 A3 w
4.3 改正后能否解除惩罚? ............................................................................................ 18
: T! X. J9 V# _5 联系与反馈.............................................................................................................. 18
: t0 Q8 N7 P( g2 N, E8 G6 关于百度的十万个为什么........................................................... 错误!未定义书签。
1 ]% v @; X0 C) Z a5 百度搜索引擎优化指南 5 g% |; Q4 q- B" N% n: E3 w
1 前期准备
3 _1 K' G; `9 W" ~3 Y域名和服务器空间是网站建设的基础。 6 b& p4 w W$ F, i' m
1.1 域名注册 % K$ z X- J# G
域名是用户对网站的第一印象,能否让用户迅速记住域名对网站发展非常重要。建议注 5 i; x: C) {- p1 T
册域名时选择容易让用户记忆、容易产生信任感的域名,这样可以提高回头率,并方便用户 * Z) L! R+ r& a
推荐。
0 W% n# G# @2 n9 K* _% q(1) 域名尽量简短,越短的域名,用户的记忆成本就越低 7 G* v$ K6 u; K0 J5 ]
(2) 域名可以和网站主题或网站名称相呼应,让人看到域名就能联想到网站内容,比如
) N5 g4 x7 |) c0 S* [使用公司名称、商标、网站名称或者公司产品等信息来选择域名 % ?' P! g" N" s2 T R9 K2 O
(3) 使用何种形式的域名后缀对百度网页搜索没有影响,但域名后缀也需要考虑方便用
) ]/ k4 Z* {0 S7 @户记忆。.com、.cn、.net 等常见的域名后缀用户更容易记忆,一些不常见的后缀可
! w" t% w7 F. f/ s3 ^( }1 N4 y能会让用户产生不信任感,增加用户的判断成本。 1 e1 z. y5 A5 b* Q
1.2 服务器、空间租用
3 Y5 |+ r' Z0 [3 r, o/ q' c服务器、空间的速度和稳定性直接影响网站的用户体验,也会影响搜索引擎的抓取。建 , x2 o$ E1 r8 K( G
议选择服务稳定、速度快的服务器或者空间。 + t) O! B A" {9 [' C/ h K2 p
(1) 选择有实力的正规空间商
0 [& G9 G+ w4 W' q4 f4 s服务器和空间的稳定性需要一定的技术实力来保障,一些没有实力的空间商,可能无力
! _3 f/ Q$ y, U- Y提供良好的服务,服务的稳定性无法保证。甚至有空间商为了节省资源,故意屏蔽掉 . B- h, c( ?! U& O+ P
Baiduspider 的抓取,导致网站无法被百度网页搜索收录。 0 O# E! d& l; e7 }& T
(2) 保证用户的访问速度和稳定性 5 S, [1 C* i+ A* B" `
(3) 根据网站规模和要提供的服务来决定选择购买何种空间(服务器)
5 M9 C, N( ?' {& v4 C! N, t9 ]/ s通常空间都会有流量、连接数以及功能上的限制,因为是多个网站共用一台服务器,稳 7 S9 S/ Q8 O% d3 p% d
定性会受到影响,但价格便宜;服务器各种限制较少,可以更自主的管理,但价格较贵。可 # j8 b9 ~1 z: g( V
以根据自己的需求来进行合理的选择。 # H3 W: A4 Z7 w7 R( W
(4) 根据用户群分布选择接入商
' ^9 n" ?$ C1 F/ q- `' F6 [由于互通问题的存在,选择接入商也很重要,如果用户群主要在联通,就尽量选择联通
( P1 j H2 p x7 S& M# k访问较好的接入商,如果用户群主要在电信,则选择电信访问较好的接入商。如果用户群在
& y% N A6 V- S/ X, U; J全国,那就选择一家互通处理的比较好的接入商。 ) E7 {8 [- ^( i1 \$ L2 u( D
6 百度搜索引擎优化指南
6 V/ e! O0 Y. T* ~8 d: o2 u5 d购买之前,可以先找一两个空间商现有的客户网站,测试访问情况如何。
) h: m1 ^% D, _/ j: N% W2 面向搜索引擎的网站建设
+ w5 [* F% o" e) k搜索引擎只是网站上一个普通的访客,对网站的抓取方式、对网站/网页的价值判断, 0 L; g. k3 C9 U. W5 g
也都是从用户的角度出发的,任何对用户体验的改进,都是对搜索引擎改进。对搜索引擎的 - M2 \6 P+ k- R3 g( g7 y9 k
优化,同时也会让用户受益。
+ v2 X" k a% E2 c8 a8 k7 j9 V面向搜索引擎的网站建设,主要分为三个部分:如何更好的让搜索引擎收录网站中的内 4 s7 C2 |9 b8 ]8 `5 F9 n$ c
容、如何在搜索引擎中获得良好的排名、如何让用户从众多的搜索结果中点击你的网站。简
8 i" d8 Y5 {- g; s* H单来说,就是收录、排序、展现。下面我们将从这三个方面分别介绍。 3 p% L$ f3 z3 r" e+ j2 |
2.1 良好收录
- |" ?, x1 O# N1 h8 \7 ^" v2.1.1 机器可读 ! a4 \" @7 g) I$ p" \
百度通过一个叫做Baiduspider 的程序抓取互联网上的网页,经过处理后建入索引中。
) N3 r/ J3 D$ c0 x% K8 \目前Baiduspider 只能读懂文本内容,flash、图片等非文本内容暂时不能处理,放置在flash、
6 E8 K/ d0 Q4 ^0 |0 s' C: K6 ~+ ^图片中的文字,百度无法识别。
. B7 D/ I& ]+ R建议使用文字而不是flash、图片、Javascript 等来显示重要的内容或链接,搜索引擎
! B7 s* F/ r2 \6 q7 v暂时无法识别Flash、图片、Javascript 中的内容,这部分内容无法搜索到;仅在flash、
( J5 h2 I% ]2 p2 G9 c tJavascript 中包含链接指向的网页,百度可能无法收录。 " b3 ~2 U/ \, g( O# O8 D; w
冘 使用文字而不是flash、图片、Javascript 等来显示重要的内容或链接 7 r/ c6 v+ p; j. \8 y
冘 如果必须使用Flash 制作网页,建议同时制作一个供搜索引擎收录的文字版,并在首页 , F8 w+ o7 n, Y7 s
使用文本链接指向文字版 & ~0 V& Z" i7 b
冘 Ajax 等搜索引擎不能识别的技术,只用在需要用户交互的地方,不把希望搜索引擎“看” - p- _" n9 u4 E! P
到的导航及正文内容放到Ajax 中
9 Z! o9 H9 t; `0 \9 X冘 不使用frame 和iframe 框架结构,通过iframe 显示的内容可能会被百度丢弃 # V4 R0 x3 c! |. U& _
我们建议: 7 D% D2 `2 r) N, Q' ~0 J8 f8 A4 w
7 百度搜索引擎优化指南
$ |3 d1 [8 h, R6 g. Z7 ?上面例子中,虽然网页上提供了很丰富的信息,但由于信息都在falsh 中,搜索引擎无法提取,对 ; a3 g# d6 l9 G7 z5 n
搜索引擎来讲,这个网页没有任何内容。 % [+ a8 g) F8 p
2.1.2 网站结构 , M4 D1 b2 V* d1 |' A0 U# ^
网站应该有清晰的结构和明晰的导航,这能帮助用户快速从你的网站中找到自己需要的
9 i i! z! Z/ R9 w+ g# `0 a) F% i内容,也可以帮助搜索引擎快速理解网站中每一个网页所处的结构层次。 ( h6 |; N+ h8 b& V# Y
网站结构建议采用树型结构,树型结构通常分为以下三个层次:首页——频道——文章
$ ?5 \* N1 g6 k# l* \页。象一棵大树一样,首先有一个树干(首页),然后再是树枝(频道),最后是树叶(普通
, h F P2 |) h r内容页)。树型结构的扩展性更强,网站内容变多时,可以通过细分树枝(频道)来轻松应 9 m: T1 r% ^% u+ K1 |0 [4 B( B
对。
" E( x; o& w! C- L理想的网站结构应该是更扁平一些,从首页到内容页的层次尽量少,这样搜索引擎处理
( {) Z. O: L* L9 ~* j起来,会更简单。 $ D- U" j# u8 H! k
同时,网站也应该是一个网状结构,网站上每个网页都应该有指向上、下级网页以及相
; V: y' J- M' ~0 D关内容的链接:首页有到频道页的链接,频道页有到首页和普通内容页的链接、普通内容页
6 v+ v& Y; b- n2 ~0 g有到上级频道以及首页的链接、内容相关的网页间互相有链接。
# I% [' i+ Y! u7 J9 N" f) V网站中每一个网页,都应该是网站结构的一部分,都应该能通过其他网页链接到。 & l3 M3 a- N8 e4 ^* l
总结一下,合理的网站结构应该是一个扁平的树型网状结构.........。
3 V2 R3 h/ X& F2 I3 j7 o* m冘 确保每个页面都可以通过至少一个文本链接到达。 . {8 z; J' Q) a% e4 C: [0 X# b
冘 重要的内容,应该能从首页或者网站结构中比较浅的层次访问到。 - ?5 I% h, q* H9 W/ R& B3 p
我们建议: : E+ f, T/ a9 P1 U) O# S! t" ?
8 百度搜索引擎优化指南 5 A) F( P0 b& Z) P
冘 合理分类网站上的内容,不要过度细分。 ( x4 v, W/ L4 h& U* ?9 T
网站应该有简明、清晰的导航,可以让用户快速找到自己需要的内容,同时也可以帮助
+ |& ]$ }& E" G搜索引擎更好的了解网站的结构。
" ?9 W; g* D% U7 Y4 Q冘 为每个页面都加上导航栏,让用户可以方便的返回频道、网站首页,也可以让搜索引擎
7 c1 r1 V# G2 v方便的定位网页在网结构中的层次。 ) i- s5 W9 }# T
冘 内容较多的网站,建议使用面包屑式的导航,这更容易让用户理解当前所处的位置:网 O2 ~0 k+ {, d- o7 e {
站首页> 频道> 当前浏览页面
/ y+ L1 L% S2 K, y% o3 v; ?通过面包屑导航,用户可以很清楚的知道自己所在页面在整个网站中的位置,可以方便的返回上 8 ~6 D6 u8 x& ]# P( P. O5 u
一级频道或者首页也很方便。 ' [0 X2 R- X% N/ }( v: G' X
冘 导航中使用文字链接,不使用复杂的js 或者flash
. ~( {# y; r+ i3 m. }1 x4 @2 o冘 使用图片做导航时,可以使用Alt 注释,用Alt 告诉搜索引擎所指向的网页内容是什么
' u9 ^1 G/ h/ o' f! S' P4 }* J2.1.3 子域名与目录的选择
0 Y+ F) ]7 A( ~# R选择使用子域名还是目录来合理的分配网站内容,对网站在搜索引擎中的表现会有较大
! W1 [# s6 X1 V6 Y3 h8 Q的影响。
* ^' v& F0 y# e* D9 k# h6 d冘 在某个频道的内容没有丰富到可以当做一个独立站点存在之前,使用目录形式;等频
& I7 |. T3 Q5 R. L! w8 g, V道下积累了足够的内容,再转换成子域名的形式 * @& l7 \7 J* {3 t+ a
一个网页能否排到搜索结果的前面,“出身”很重要,如果出自一个站点权重较高的
$ m$ |5 M; m7 Q {网站,那排到前面的可能性就越大,反之则越小。通常情况下主站点的权重是最高的,
. y/ l }7 b8 o: x1 P子站点会从主站点继承一部分权重,继承的多少,视子站点质量而定。
* s" ~: @0 ^* [* q3 c在内容没有丰富到可以做为一个独立站点之前,内容放到主站点下一个目录中能在
* L m: w1 b9 j搜索引擎中获得更好的表现。 & P5 x2 q2 S1 Z5 P" ^
冘 内容差异度较大、关联度不高的内容,使用子站点形式 o9 P/ x9 p% V" v2 T* }" V5 U
搜索引擎会识别站点的主题,如果站点中内容关联度不高,可能导致搜索引擎错误
) Y; m) R8 L+ f8 N1 J2 _的识别。关联度不高的内容,放在不同的子域名下,可以帮助搜索引擎更好的理解站点
' ]- y" k* G8 N* k) I2 I4 [' Q的主题。 % }$ S: X9 e1 c7 w1 K
冘 域名间内容做好权限,互相分开,a. example.com 下的内容,不能通过b.
9 f5 x7 H! I8 G8 {" Kexample.com 访问
" N0 }5 k" x- i/ k4 y# T/ n0 n子域名间的内容可以互相访问,可能会被搜索引擎当做重复内容而进行除重处理,
7 s# U2 d. Y7 q我们建议:
5 J+ ]5 o6 }9 B+ y; q/ x我们建议: ) O+ i9 c) u9 A
9 百度搜索引擎优化指南
3 O" ^+ X9 k) }; ^( b保留的url 不一定是正常域名下的。 / U+ }9 C9 U/ e, K' f
冘 不要滥用子域名 7 k6 G8 d& g% o( {& ?
无丰富内容而滥用大量子域名,会被搜索引擎当做作弊行为而受到惩罚。
|