|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?注册
×
SEO们经常头疼的一个问题,没有收录、索引就无从谈排名。尤其对达到一定规模的网站来说,使网站充 分收录是个颇令人费神的SEO技术,当页面达到比如说几十万,无论网站架构怎么设计、多么优化,100%收录都是不可能的,只能尽量提高收录率。 但有时候怎么阻止搜索引擎收录也可能成为一个问题,最近越来越成为问题。需要阻止收录的情况如保密信息、复制内容、广告链接等。过去常用的阻止收录方法包括密码保护、把内容放在表格后面、使用JS/Ajax、使用Flash等。今天看到Google网管博客一篇文章,这些方法都不保险。
0 P. T0 @8 ^2 j- p( j, ?+ p# a& {
2 E0 i6 F# `7 }, E 使用Flash* u2 ]8 d7 B' d6 r0 f9 [" g
3 W. Y9 P6 _; z7 [7 _ Z; c, q
Google几年前就开始尝试抓取Flash内容了,简单文字性内容已经能抓取。Flash里面的链接也能被跟踪。
! s8 a# X7 m+ [; y* |! V2 R9 h9 z% v i* h% P7 c0 d, Y; H
表格
+ X }$ o0 H5 T3 ^' a" m# m
! N4 O- e' l# W- Y/ _ Google蜘蛛也能填表,也能抓取POST请求页面。这个早就能从日志中看到。
* G3 ?' r+ B, i) {4 x7 P" ]! J+ V
- K# ~: U- F2 {- {% z JS/Ajax; e/ X B1 I4 ?5 }- W. y2 W
% ~- L# e& w9 R# `8 K( w
使用JS链接一直以来被当作不搜索引擎友好的方法,因此可以阻止蜘蛛爬行,但两三年前我就看到JS链接不能阻止Google蜘蛛抓取,不仅JS中出现的URL会被爬,简单的JS还能被执行找到更多URL。# a- G# p2 c$ C/ c
% Q. u' v& [- O+ j
前几天有人发现很多网站使用的Facebook评论插件里的评论被爬、被收录,插件本身是个AJAX。这是个好消息。我的一个实验电子商务网站产品 评论功能就因为这个费了不少心思,用Facebook comments插件好处大大的,具体什么好处以后有时间再说,唯一的问题就是评论是AJAX实现的,不能被抓取,而产品评论被收录是目的之一(产生原创 内容)。我当时想了半天也没有解决方法,只好先傻傻地既放上Facebook comments插件又打开购物车本身的评论功能。现在好了,Facebook comments里的评论能被收录,就不用两套评论功能了。& P- `' [, J; E+ a+ Y1 ?1 y0 j' t) @
" c$ ^1 k& I* T4 b Robots文件
0 y u, `3 z: g/ y2 w) j$ H4 O* j/ w$ e8 z3 ]) m- m; R
目前唯一确保内容不被收录的方法是robots文件禁止。但也有个坏处,会流失权重,虽然内容是不能收录了,但页面成了只接受链接权重、不流出权重的无底洞。' |- ~/ X4 o0 n$ o+ g! f% |: Z
% \) z. M7 t: n f# I: Z( m; W5 p
Nofollow" c" e5 `5 m% n G; ^- v2 X
5 ?3 c5 y" V$ a" D
Nofollow并不能保证不被收录。就算自己网站所有指向页面的链接都加了NF,也不能保证别人网站不给这个页面弄个链接,搜索引擎还是能发现这个页面。
& ?* Y- m; A; S$ z' I4 N w7 B$ b5 K3 G
怎样使页面不被收录是个值得思考的问题,没意识到严重性的童鞋可以想想自己网站上有多少复制内容、低质量内容、各种无搜索价值(但用户觉得方便、有用所以又不能拿掉)的分类、过滤URL。
9 C, v! n; @ ?' h* _6 m* B! G5 s, d1 R5 F: o7 d
本文由http://www.74981.com 整理,转载请保留出处74981.com游戏网!# C ~- @' X1 F2 a( D$ Z7 o
|
|