google
[[google]] last edit on
Jan 4, 2006
10:41 AM
by Anonymous
除了搜寻网页外,Google亦提供搜寻图像、新闻组、新闻网页、影片的服务。2005年6月,Google已储存超过80亿的网页,1亿3千万张图片,与及超过1亿的新闻组讯息 - 总计大概10亿4千万个项目。它也缓存了编入索引中的绝大多数网页的内容。
因为Google的名声,"Google"一个事物做动词表示的是"在Google上寻找某事"。它有宽泛的"搜索网路"的意思。Google官方并不鼓励这种滥用他们公司名字的习惯,因为它可能导致Google变成一个通用商标名。
历史
Google 搜寻器在1996年由Larry Page 和Sergey Brin 开始展开研究计划。他们是史丹福大学的毕业生。他们开发论说,提出搜寻器与网站是基于数学上分析的关系,比基础技术制造更好的效果。这个计划被命名为"BackRub",因为该系统检查外来网站连结来估计该网站的重要性。他们相信,其他与该网页相关性较高,而连结最多到该网页,必定是最相关之一。Larry Page 和 Sergey Brin 决定去测试他们的论点,并安排基金给这搜寻器。这网站名为 Google! 存放于网域名称 google.com. 他们于1998年9月7日,加洲门洛帕克的朋友车房,正式创立相同名称的公司 - Google Inc.。Sergey Brin 因为不懂编写HTML码用来设计网页,所以最初Google的页面只是最基本的接口。
Google于2000年引入广告,卖出一些关键词,令到广告更能与用家相关,另外因文字广告是顺序编排,减少了加载的时间和令页面保持整齐。2001年9月,Google排名机构PageRank给予了美国专利权。专利权由史丹福大学和Lawrence Page授予给发明者。于2004年较早的高峰期,Google 掌管整个因特网所有搜寻器如 Yahoo、AOL和CNN等的80%以上的搜索查询。而Yahoo! 放弃了Google的搜寻技术的支持,Google亦没有再提供分享其网页搜寻。
Google搜寻有著幽默的特色,例如Google标志在较重要时刻被卡通化修改(称为 Google Doodles),选择去虚构和幽默的语言显示Google,如Klingon 和 Leet,以及于四月的愚人节上造出一些关于公司的笑话。
这推测著Google未来是个人化的搜寻器,收集使用的资料由Google的Orkut、Gmail和Froogle 去给取搜寻结果基于个别之前所做的动作。其实,在Google Labs里已经有一个试验性的个人化搜寻。
名称来源
Google的名字是在偶然地拼错的 googol。Googol 是一个数学上的术语,表示 1 后面接著 100 个 0。此术语是由美国数学家 Edward Kasner 的侄子 Milton Sirotta 所创造,出现在 Kasner 和 James Newman 所写的《Mathematics and the Imagination》一书中而普及。Google 使用此术语来反映出公司的任务:组织网络上无穷无尽的资讯。搜索引擎
索引大小
- ~ 1998年:25万
- 2000年8月:10亿6千万
- 2002年1月:20亿7千3百万
- 2003年2月:30亿8千3百万
- 2004年9月:42亿8千5百万
- 2004年11月:80亿5千8百万个网页,8亿8千万张图片,8亿4千5百万个新闻组讯息,4千5百个新闻讯息
- 2005年6月:80亿5千8百万个网页,11亿8千7百万张图片,10亿个新闻组讯息,6千6百个打印目录,4千5百个新闻讯息
物理构造
Google于全球数个地方,雇用服务器中心来存放较低成本的普通电脑,运行Red Hat Linux操作系统来回应搜索要求和索引网页。这个于服务器中心建立的"服务器园地"以Shared nothing architecture (分布式数据库结构) 建造。索引是由程序Googlebot执行,它会定期地请求访问已知的索引建立新页面。页面更新愈快,Googlebot访问亦会愈多。再通过在这些已索引网页上的连结来发现新页面,并加入到数据库。索引数据库和网页缓存大小是以兆兆字节(terabyte)来衡量的。Google发展了一套档案系统名为Google 档案系统 ,储存这些资料。Google使用的这些机器的精确大小和位于何处至今未知,Google官方刻意含糊其词。在John Hennessy和David A. Patterson所著的《计算机建筑:走进大数》中,推测Google的服务器场中群集计算机群形成的"搜寻场"在2000年大约应该有6000个处理器,12000个普通IDE硬盘(即每个机器2个硬盘1个处理器),他们位于四个地方:二个在 硅谷和二个在 维吉尼亚。每个都以OC 48的线路(2488 Mbit/s,参见带宽)连接着因特网并且有一个OC 12(622 Mbit/s)线路连接着其他3个Google分站点。这些连接使用思科12000网关,用二个Foundry Networks BigIron 8000的以太网交换器分流成4 x 1 Gbit/s的线路连接到64个服务器夹,里面前后各是40台电脑和1台惠普以太网交换机,所以一个架子共有80个机器和2个惠普交换机。
Google在2004年4月发布的IPO S-1表单后,大财政公司的英特网开发单位副总裁Tristan Louis估计了现在的服务器场包含下列各项:
- 719个服务器架
- 63,272台机器
- 126,544个处理器
- 253,088 GHz的处理能力
- 126,544 GB内存
- 5,062 TB的硬盘空间
依照这一估计,Google服务器场组成了全球最强大的超级计算机,每秒运行速度至少三倍于地球模拟器。
文章来自Wikipedia,中国大陆用户访问地址 h ;63322#&;02322#&;28383#&;57753#&;34152#&;29992#&;07483#&;32822#&;96222#&;31002#&;2925ecure.wikimedia.org/wikipedia/zh/wiki/Google