您当前的位置:周俊奇博客 > 杂项 > 市场营销

利用谷歌搜索服务器做搜索优化

时间:2009-08-13 21:40:07

Google推出GSA的目的是让那些信息量暴增的企业和机构能用它建立自己的搜索引擎。它支持的格式有220多种,你可以用它来抓取和收录自己的博客、网站、数据库和网络文件夹等等。它是机器和软件全部打包在一起的。

主要特点有以下这些,随意看看就好:

- 有一个连接器管理工具,可以让你收录和那些非WEB格式的文档。如:word,pdf,flash 等等
- 如果使用 Feed API 和元数据搜索功能,可以为自己的论坛建立搜索功能。
- 还提供了强大的 Onebox 编程接口,可以让你在搜索结果中展现一些定制的信息。
- 强大的安全搜索功能支持多种身份认证方式,使用户在搜索结果中只见到自己有权限访问的文档。
- 为小规模文档设计了专门的网页排序算法。
- 用户可以定制搜索结果界面,甚至以 XML 格式的形式,来整合到您自己的应用中去。

这个对SEO也是非常有用的。为什么这么说呢?

你可以把这个GSA看做是google 的微缩版,它有爬虫,有索引库,有排序算法。它的的硬件和软件都是现在google.com这个网站正在用的东西。所以两者之间相似程度非常的高。我在过去操作google mini的时候已经证实:至少它的抓取机制和现在的google.com几乎是一摸一样的。

它的排序算法,我觉得也会有很大的相似度。当然不会一摸一样的,因为现有的GSA好像是依据06年的搜索技术改变而来,而以google每年450次的算法调整频率,到现在也相差比较多了。但是至少和现在的排序算法会有相当大的相似度。

还有一些有意思的东西,大家看上面提到的两个特点:“Onebox 编程接口”和“在搜索结果中只见到自己有权限访问的文档”。这其实就是现在google的一些应用。

Onebox在搜索引擎现有的排序算法中享有优先级,它的数据来源就是Google Base或其他google产品。这次GSA也提供了这种Onebox的编程接口,现在自己亲手给自己的GSA添加Onebox,一定会对你如何利用Onebox拿到更多流量有帮助的。

“在搜索结果中只见到自己有权限访问的文档”,这个就类似igoogle 。还有google其他一些产品,在搜索结果页面,你登陆了gmail看到的和不登陆看到的是不一样的。

836