本篇文章427字,读完约1分钟
如果我们从搜索引擎的角度去看一个网站,蜘蛛在爬抓、索引和排名时会遇到哪些问题呢?如果我们解决这些问题后,那么就能设计出一个对搜索引擎很友好的网站。
一、搜索引擎蜘蛛能不能发现网页:如果要让搜索引擎发现网站,那么就必须有外部链接链向首页,只有蜘蛛找到首页后,才能沿着内部链接找到更深的内容页,这就要求网站有着良好的结构,并且所有页面都能通过连接达到。
二、找到页面后能不能正常抓取页面内容:被发现的URL必须是能被抓取的,数据库生成动态、带有过多参数的URL、Session ID、整站Flash、框架、可以转向、大量垃圾信息等,都可能导致搜索引擎不会收录。
三、抓取页面后要怎样提炼信息:关键词在页面的重要位置的分布、重要标签的撰写、html代码的精简、起码的兼容性等,都可以帮助搜索引擎理解网页内容,提取重要信息。
所以只有搜索引擎顺利的找到网页,抓取这些页面并提取出其中的重要信息,这样的网站才能回被搜索引擎视为友好网站。 |