【文档说明】第4课《信息的搜索》教案3-八年级下册信息技术【川教版】.doc,共(25)页,183.500 KB,由小喜鸽上传
转载请保留链接:https://www.ichengzhen.cn/view-90689.html
以下为本文档部分文字说明:
搜索引擎编辑词条B添加义项?搜索引擎指自动从因特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。因特网上的信息浩瀚万千,而且毫无秩序,所有的信息像汪洋上的一个个小岛,网页链接是这些小岛之间纵横交错的桥梁,而搜索引擎,则为用户绘制一幅一目了然的信息地图,供用户随时查阅。它们从互联网提取各个网
站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。基本信息中文名搜索引擎外文名searchengine分类全文索引、目录索引等代表百度、谷歌等目录1种类划分2工作原理3发展历史4重要影响5目标层次6作用
效果7商务模式8组成部分9市场规模10语言判断11技术发展12未来展望13使用技巧14现状15最新消息16发展折叠编辑本段种类划分折叠全文索引全文搜索引擎是目前广泛应用的主流搜索引擎,国外代表搜索是Google,国内则有最大中文搜索百度。它们从
互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。[1]根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序(Indexer),俗称
“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和360搜索就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜
索引擎。在搜索引擎分类部分提到过全文搜索引擎从网站提取信息建立网页数据库的概念。搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(比如Google一般是28天),搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和
网址加入自己的数据库。另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2天到数月不等)定向向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库,以备用户查询。由于近年来搜索引擎索引规
则发生很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,目前最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到你并自动将你的网站收录。当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网
站,便采用特殊的算法——通常根据网页中关键词的匹配程度、出现的位置、频次、链接质量——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。这种引擎的特点是搜全率比较高。折叠目录索引目录索
引也称为:分类检索,是因特网上最早提供WWW资源查询的服务,主要通过搜集和整理因特网的资源,根据搜索到网页的内容,将其网址分配到相关分类主题目录的不同层次的类目之下,形成像图书馆目录一样的分类树形结构索引。目录索引无需输入任何文字,只要根据网站提供的主题分类目录,层层
点击进入,便可查到所需的网络信息资源。虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询
。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo、新浪分类目录搜索。与全文搜索引擎相比,目录索引有许多不同之处。首先,搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。用户提交网站后,目录编辑人员会亲自浏览你的网站,然
后根据一套自定的评判标准甚至编辑人员的主观印象,决定是否接纳你的网站。其次,搜索引擎收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功。而目录索引对网站的要求则高得多,有时即使登录多次也不一定成
功。尤其象Yahoo这样的超级索引,登录更是困难。此外,在登录搜索引擎时,我们一般不用考虑网站的分类问题,而登录目录索引时则必须将网站放在一个最合适的目录(Directory)。最后,搜索引擎中各网站的有关信息都是从用
户网页中自动提取的,所以从用户的角度看,我们拥有更多的自主权;而目录索引则要求必须手工另外填写网站信息,而且还有各种各样的限制。更有甚者,如果工作人员认为你提交网站的目录、网站信息不合适,他可以随时对其进行调整,当然事先是不会和你商量的。
目录索引,顾名思义就是将网站分门别类地存放在相应的目录中,因此用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。如以关键词搜索,返回的结果跟搜索引擎一样,也是根据信息关联程度排列网站,只不过其中人为因素要多一些。如果按分层目录查找,某一目录中网站的排名则是由标题字母的先后顺
序决定(也有例外)。目前,搜索引擎与目录索引有相互融合渗透的趋势。原来一些纯粹的全文搜索引擎现在也提供目录搜索,如Google就借用OpenDirectory目录提供分类查询。而象Yahoo!这些老牌目录索引则通过与Google等搜索
引擎合作扩大搜索范围(注)。在默认搜索模式下,一些目录类搜索引擎首先返回的是自己目录中匹配的网站,如中国的搜狐、新浪、网易等;而另外一些则默认的是网页搜索,如Yahoo。这种引擎的特点是找的准确率比较高。搜索引擎与目录索引有相互融合渗透的趋势。一些纯粹的全文搜索引擎也提供目录搜
索,如Google就借用OpenDirectory目录提供分类查询。而像Yahoo!;这些老牌目录索引则通过与Google等搜索引擎合作扩大搜索范围(注)。在默认搜索模式下,一些目录类搜索引擎首先返回的是自己目录中匹配的网站,如中国的搜狐、新浪、网易等;
而另外一些则默认的是网页搜索,如Yahoo。这种引擎的特点是找的准确率比较高。折叠元搜索引擎元搜索引擎(METASearchEngine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、
Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。折叠垂直搜索引擎垂直搜索引擎为2006年后逐步兴起的一类搜索引擎。不同于通用的网页搜索引擎,垂直搜索
专注于特定的搜索领域和搜索需求(例如:机票搜索、旅游搜索、生活搜索、小说搜索、视频搜索等等),在其特定的搜索领域有更好的用户体验。相比通用搜索动辄数千台检索服务器,垂直搜索需要的硬件成本低、用户需求特定、查询的方式多
样。折叠集合式搜索引擎集合式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎。折叠门户搜索引擎门户搜索引擎:AOLSearch、
MSNSearch等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎。折叠免费链接列表免费链接列表(FreeForAllLinks简称FFA):一般只简单地滚动链接条目,少部分有简单的分类目录
,不过规模要比Yahoo!等目录索引小很多。折叠编辑本段工作原理折叠抓取网页每个独立的搜索引擎都有自己的网页抓取程序(spider)。Spider顺着网页中的超链接,连续地抓取网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应
用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。折叠处理网页搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、
计算网页的重要度/丰富度等。折叠提供检索服务用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。折叠编辑本段发展历史互联网发展早期,以雅虎为代表的网站分类目录查询非常流行。网
站分类目录由人工整理维护,精选互联网上的优秀网站,并简要描述,分类放置到不同目录下。用户查询时,通过一层层的点击来查找自己想找的网站。也有人把这种基于目录的检索服务网站称为搜索引擎,但从严格意义上讲,它并不是搜索引擎。1990年,加拿大麦吉尔大学(UniversityofMcGill)计算
机学院的师生开发出Archie。当时,万维网(WorldWideWeb)还没有出现,人们通过FTP来共享交流资源。Archie能定期搜集并分析FTP服务器上的文件名信息,提供查找分别在各个FTP主机中的文件。用户必须输入精确的文件名进行搜索,Archie告诉用户哪个FTP
服务器能下载该文件。虽然Archie搜集的信息资源不是网页(HTML文件),但和搜索引擎的基本工作方式是一样的:自动搜集信息资源、建立索引、提供检索服务。所以,Archie被公认为现代搜索引擎的鼻祖。现在中国已经步入了快速发展的第三阶段,由于百度上市后,引发的中国搜索概念正在红遍全球。作为网
络营销的助推器,搜索引擎产业已成功发展出搜索技术服务、关键词广告、竞价排名等几种搜索引擎,已成为中国互联网产业中最引人注目的亮点之一。折叠起源所有搜索引擎的祖先,是1990年由Montreal的McGillUniversity三名学生(AlanEmtage、Pe
terDeutsch、BillWheelan)发明的Archie(ArchieFAQ)。AlanEmtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。Archie是第一个自动索引互联网上匿名FTP网站文件
的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。由于Archie深受欢迎,受其启发,NevadaSystemComput
ingServices大学于1993年开发了一个Gopher(GopherFAQ)搜索工具Veronica(VeronicaFAQ)。Jughead是后来另一个Gopher搜索工具。折叠发展(1)Excite的历史可以上溯到1993年2月
,6个StanfordUniversity(斯坦福大学)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。到1993年中,这已是一个完全投资项目,他们还发布了一个供webmasters在自己网站上使用的搜索软件版本,后来被叫做Excitefo
rWebServers。注:Excite后来曾以概念搜索闻名,2002年5月,被Infospace收购的Excite停止自己的搜索引擎,改用元搜索引擎Dogpile折叠发展(2)1994年4月,斯坦福大学的两名博士生,美籍华人杨致远和DavidFilo共
同创办了Yahoo!。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。Yahoo!中收录的网站,因为都附有简介信息,所以搜索效率明显提高。注:Yahoo
以后陆续有Altavista、Inktomi、Google提供搜索引擎服务Yahoo!--几乎成为20世纪90年代的因特网的代名词。折叠发展(3)1995年,一种新的搜索引擎形式出现了——元搜索引擎(Me
taSearchEngine)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎,是Washington大学硕士生EricSelberg和OrenEtzion
i的Metacrawler。元搜索引擎概念上非常好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。折叠发展(4)智能检索的产生:它利用分词词典、同义词典,同音词典改善检索效果,进一步还可在知识层面或者说概念层面上辅助查询,通过主题词典、上下位词典、
相关同级词典检索处理形成一个知识体系或概念网络,给予用户智能知识提示,最终帮助用户获得最佳的检索效果。例:(1)查询“计算机”,与“电脑”相关的信息也能检索出来;(2)可以进一步缩小查询范围至“微机”、“服务器”或扩大查询至“信息技术”或查询相关的“电子技术”、“
软件”、“计算机应用”等范畴;(3)还包括歧义信息和检索处理,如“苹果”,究竟是指水果还是电脑品牌,“华人”与“中华人民共和国”的区分,将通过歧义知识描述库、全文索引、用户检索上下文分析以及用户相关性反馈等技术结合处理,高效、准确
地反馈给用户最需要的信息。折叠发展(5)个性化趋势是搜索引擎的一个未来发展的重要特征和必然趋势之一。一种方式通过搜索引擎的社区化产品(即对注册用户提供服务)的方式来组织个人信息,然后在搜索引擎基础信息库的检索中引入个人因素进行分析,获得针对个人不同的搜
索结果。自2004年10月yahoo推出myweb测试版,到11月a9推出个性化功能,到2005年Googlesearchhistory基本上都沿着一条路子走,分析特定用户的搜索需求限定的范围,然后按照用户需求范围扩展到互联网上其
他的同类网站给出最相关的结果。另外一种是针对大众化的,Google个性化搜索引擎,或者yahooMindSet,或者我们都知道的前台聚类的vivisimo。但是无论其中的哪一种实现方式,即Google的主动选择搜索范围,还是yahoo,vivisimo的在结果中重新组织自己需要的信息,都是一
种实验或者创想,短期内无法成为主流的搜索引擎应用产品。折叠发展(6)网格技术(greatglobalgrid):由于没有统一的信息组织标准对网络信息资源进行加工处理,难以对无序的网络信息资源进行检索、交接和共享乃至深层次的开发利用
,形成信息孤岛。网格技术就是要消除信息孤岛实现互联网上所有资源的全面连通。全球信息网格(GlobalInformationGrid)Robot(机器人)一词对编程者有特殊的意义。ComputerRobot是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。由于专门用于检索信
息的Robot程序像蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider程序。1993年MatthewGray开发了WorldWideWebWanderer,这是第一个利用HTML网页之间的链接关系来检测
万维网规模的“机器人(Robot)”程序。开始,它仅仅用来统计互联网上的服务器数量,后来也能够捕获网址(URL)。1994年4月,斯坦福大学(StanfordUniversity)的两名博士生,美籍华人JerryYang(杨致远)和DavidFilo共同创
办了Yahoo。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。雅虎于2002年12月23日收购inktomi,2003年7月14日收购包括Fast和Altavis
ta在内的Overture,2003年11月,Yahoo全资收购3721公司。1994年初,华盛顿大学(UniversityofWashington)的学生BrianPinkerton开始了他的小项目WebCrawler。1994年4月20日,WebCrawler正式亮相时仅包含来自6000个服务
器的内容。WebCrawler是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前100个字。1994年7月,卡内基·梅隆大学(CarnegieMellonUnive
rsity)的MichaelMauldin将JohnLeavitt的spider程序接入到其索引程序中,创建了Lycos。除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动
摘要,而最大的优势还是它远胜过其它搜索引擎的数据量。1994年底,Infoseek正式亮相。其友善的界面,大量的附加功能,使之和Lycos一样成为搜索引擎的重要代表。1995年,一种新的搜索引擎形式出现了——元搜索引擎(AM
etaSearchEngineRoundup)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理,提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎,是Washington大学硕士生EricSelberg和Or
enEtzioni的Metacrawler。1995年12月,DEC的正式发布AltaVista。AltaVista是第一个支持自然语言搜索的搜索引擎,第一个实现高级搜索语法的搜索引擎(如AND、OR、NOT等)。用户可以用AltaVista搜索新闻
组(Newsgroups)的内容并从互联网上获得文章,还可以搜索图片名称中的文字、搜索Titles、搜索Javaapplets、搜索ActiveXobjects。AltaVista也声称是第一个支持用户自己向网页索引库提交或删除URL的搜索引擎,并能在24小时内上线。A
ltaVista最有趣的新功能之一,是搜索有链接指向某个URL的所有网站。在面向用户的界面上,AltaVista也作了大量革新。它在搜索框区域下放了“tips”以帮助用户更好的表达搜索式,这些小tip经常更新,这样,在搜索过几次以
后,用户会看到很多他们可能从来不知道的的有趣功能。这系列功能,逐渐被其它搜索引擎广泛采用。1997年,AltaVista发布了一个图形演示系统LiveTopics,帮助用户从成千上万的搜索结果中找到想要的。1995年9月26日,加州伯克利分校助教Eri
cBrewer、博士生PaulGauthier创立了Inktomi,1996年5月20日,Inktomi公司成立,强大的HotBot出现在世人面前。声称每天能抓取索引1千万页以上,所以有远超过其它搜索引擎的新内容。HotBot也大量运用cookie储存用户的个人搜
索喜好设置。1997年8月,Northernlight搜索引擎正式现身。它曾是拥有最大数据库的搜索引擎之一,它没有StopWords,它有出色的CurrentNews、7100多出版物组成的SpecialCollection、良好的
高级搜索语法,第一个支持对搜索结果进行简单的自动分类。1998年10月之前,Google只是斯坦福大学(StanfordUniversity)的一个小项目BackRub。1995年博士生LarryPage开
始学习搜索引擎设计,于1997年9月15日注册了域名,1997年底,在SergeyBrin和ScottHassan、AlanSteremberg的共同参与下,BachRub开始提供Demo。1999年2月,Google完成了从Alpha版到Be
ta版的蜕变。Google公司则把1998年9月27日认作自己的生日。Google以网页级别(Pagerank)为基础,判断网页的重要性,使得搜索结果的相关性大大增强。Google公司的奇客(Geek)文化氛围、不作恶(Don’tbeevil)的理念,
为Google赢得了极高的口碑和品牌美誉。2006年4月,Google宣布其中文名称“谷歌”,这是Google第一个在非英语国家起的名字。Fast(Alltheweb)公司创立于1997年,是挪威科技大学(NTNU)学术研究的副产品。1999年5月,发布了自己的搜索引擎AllTheWeb。Fast
创立的目标是做世界上最大和最快的搜索引擎,几年来庶几近之。Fast(Alltheweb)的网页搜索可利用ODP自动分类,支持Flash和pdf搜索,支持多语言搜索,还提供新闻搜索、图像搜索、视频、MP3、和FTP搜索,拥有极其强大的高
级搜索功能。(2003年2月25日,Fast的互联网搜索部门被Overture收购)。1996年8月,sohu公司成立,制作中文网站分类目录,曾有“出门找地图,上网找搜狐”的美誉。随着互联网网站的急剧增加,这
种人工编辑的分类目录已经不适应。sohu于2004年8月创建独立域名的搜索网站“搜狗”,自称“第三代搜索引擎”。Openfind创立于1998年1月,其技术源自台湾中正大学吴升教授所领导的GAIS实验室。Openfind起先只做中文搜索引擎,鼎盛时期同
时为三大著名门户新浪、奇摩、雅虎提供中文搜索引擎,但2000年后市场逐渐被Baidu和Google瓜分。2002年6月,Openfind重新发布基于GAIS30Project的Openfind搜索引擎Beta版,推出多元排序(PolyRankTM),宣布累计抓取网页3
5亿,开始进入英文搜索领域。2000年1月,两位北大校友,超链分析专利发明人、前Infoseek资深工程师李彦宏与好友徐勇(加州伯克利分校博士后)在北京中关村创立了百度(Baidu)公司。2001年8月发布百度搜索引擎Beta版(此前Baidu只为其它门户网站搜狐新浪Tom等提供搜索引擎),
2001年10月22日正式发布Baidu搜索引擎,专注于中文搜索。Baidu搜索引擎的其它特色包括:百度快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、mp3搜索、Flash搜索。2002年3月闪电计划(Bl
itzenProject)开始后,技术升级明显加快。后推出贴吧、知道、地图、国学、百科、文档、视频、博客等一系列产品,深受网民欢迎。2005年8月5日在纳斯达克上市,发行价为USD27.00,代号为BIDU。开盘价USD66.00,以USD122.54收盘,涨幅353.8
5%,创下了5年以来美国股市上市新股当日涨幅最高纪录。2003年12月23日,原慧聪搜索正式独立运做,成立了中国搜索。2004年2月,中国搜索发布桌面搜索引擎网络猪1.0,2006年3月中搜将网络猪更名为IG(InternetGateway)。2005年6月,
新浪正式推出自主研发的搜索引擎“爱问”。2007年起,新浪爱问使用google搜索引擎。2007年7月1日全面采用网易自主研发的有道搜索技术,并且合并了原来的综合搜索和网页搜索。有道网页搜索、图片搜索和博客搜索为网易搜索提供服务。其中网页搜索使用了其自主研发的自然语言
处理、分布式存储及计算技术;图片搜索首创根据拍摄相机品牌、型号,甚至季节等高级搜索功能;博客搜索相比同类产品具有抓取全面、更新及时的优势,提供“文章预览”,“博客档案”等创新功能。折叠编辑本段重要影响折叠网吧走进网吧,不难发现各个网吧内
的电脑浏览器首页或工具条上都会有google或百度的标志。百度甚至还推出了网吧联盟,可见搜索引擎们对网吧行业都格外的青睐。现在我们常用的搜索引擎无非就是百度和google两种。从百度方面来看,百度联盟可以算是目前
唯一一个能够覆盖所有网吧并和几乎所有主流网吧软件缔结合作关系的媒体运营平台。而google方面也不甘示弱,谷歌已经注意到了网吧市场,网吧已经成为了谷歌的新型合作伙伴。网吧的首页和工具条上都会出现谷歌的标志,相应地会给谷歌带去流量。谷歌对网吧市场的
关注,表明谷歌注意到网吧作为中国互联网市场的特色之一。由于我国PC拥有量远落后于美国等西方国家,网吧作为网民主要上网地点的比例逐年在上升,我国网民在网吧上网的比例偏高。据CNNIC第20次中国互联网络发展状况统计报告显示,超过1/3(37.2%)的网民表示经常去网吧上网,比200
6年12月的32.3%高了5个百分点,第一次超过网民在工作单位上网的比例而成为第二大上网场所。折叠网站一个网站的命脉就是流量,而网站的流量可以分为两类。一类是自然流量,一类就是通过搜索引擎而来的流量。如果搜索引擎能
够更多更有效的抓取网站内容,那么对于网站的好处是不言而喻的。所以,SEO也应运而生了。在百度和谷歌两大搜索引擎的工作中,百度的工作周期相对来说短一些,百度大约在10天左右重新访问网站一次,Google大约在15天左右重新访问一次网站。由于一天之内不能游历全球所
有的网站,如果推广网站时,能到更多的网站上提交相应的网站信息,也是加快蜘蛛收录网站内容的重要环节。折叠编辑本段目标层次搜索引擎营销可分为四个层次,可分别简单描述为:存在层、表现层、关注层和转化层。第一层是搜索引擎营销的存在层,其目标是在主要的搜索引擎/分
类目录中获得被收录的机会,这是搜索引擎营销的基础,离开这个层次,搜索引擎营销的其他目标也就不可能实现。第二层的目标则是在被搜索引擎收录的基础上尽可能获得好的排名,即在搜索结果中有良好的表现,因而可称为表现层。搜索引擎营销的第三个目标则直接表
现为网站访问量指标方面,也就是通过搜索结果点击率的增加来达到提高网站访问量的目的。由于只有受到用户关注,经过用户选择后的信息才可能被点击,因此可称为关注层。搜索引擎营销的第四个目标,即通过访问量的增加转化为企业最终实现收益的提高,可称为转化层。转化层是前面三个目标
层次的进一步提升,是各种搜索引擎方法所实现效果的集中体现,但并不是搜索引擎营销的直接效果。折叠编辑本段作用效果搜索引擎是网站建设中针对“用户使用网站的便利性”所提供的必要功能,同时也是“研究网站用户行为的一个有效工具”。高效的站内检索可以让用户快
速准确地找到目标信息,从而更有效地促进产品/服务的销售,而且通过对网站访问者搜索行为的深度分析,对于进一步制定更为有效的网络营销策略具有重要价值。1、从网络营销的环境看,搜索引擎营销的环境发展为网络营销的推动起到举足轻重的作用;2、从效果营销看,很多公
司之所以可以应用网络营销是利用了搜索引擎营销;3、就完整型电子商务概念组成部分来看,网络营销是其中最重要的组成部分,是向终端客户传递信息的重要环节。折叠编辑本段商务模式在搜索引擎发展早期,多是作为技术提供商为其他网站提供搜索服务,网站付
钱给搜索引擎。后来,随着2001年互联网泡沫的破灭,大多转向为竞价排名方式。现在搜索引擎的主流商务模式(百度的竞价排名、Google的AdWords)都是在搜索结果页面放置广告,通过用户的点击向广告主收费。这种模式最早是比尔·格罗斯(BillGross)提出的。他于199
8年6月创立GoTo公司(后于2001年9月更名为Overture),实施这种模式,取得了很大的成功,并且申请了专利。这种模式有两个特点,一是点击付费(PayPerClick),用户不点击则广告主不用付费。
二是竞价排序,根据广告主的付费多少排列结果。2001年10月,Google推出AdWords,也采用点击付费和竞价的方式。2002年,Overture起诉Google侵犯了其专利。2004年8月,和Yahoo!(Yahoo!于200
3年7月收购Overture)达成和解,向后者支付了270万普通股(合3亿美元不到)作为和解费。AdSense是Google于2003年推出的一种新的广告方式。AdSense使各种规模的的第三方网页发布者进入Google庞大的广告商网络。Goo
gle在这些第三方网页放置跟网页内容相关的广告,当浏览者点击这些广告时,网页发布者能获得收入。AdSense在blogger中很受欢迎。同时,Google武断地删除一些帐号,引起部分人的不满。类似的广告方式,其他搜索引擎也先后推出
。雅虎的广告方式是YPN(YahooPublisherNetwork),YPN除了可以在网页上显示与内容相关的广告以外,还可以通过在RSS订阅中来显示广告。微软的广告计划叫AdCenter。百度也推出主题推广。折叠编辑本段组成部分搜索引擎一般由搜索器、索引器
、检索器和用户接口四个部分组成:折叠搜索器其功能是在互联网中漫游,发现和搜集信息;折叠索引器其功能是理解搜索器所搜索到的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表;折叠检索器其功能是根据用户的查询在索引库中快速检索文档,进行相关度评
价,对将要输出的结果排序,并能按用户的查询需求合理反馈信息;折叠用户接口其作用是接纳用户查询、显示查询结果、提供个性化查询项。折叠编辑本段市场规模折叠市场概述2010年4月12日,艾瑞咨询今日发布的中国搜索引擎市场份额报告显示,2009
年全球搜索引擎市场规模达339.0亿美元。中国搜索引擎市场规模达69.6亿元(约合10.2亿美元),相比2008年的50.3亿元年同比增长38.5%。预计2010年中国搜索引擎市场规模将呈现45%左右的增幅
。2009年中国网页搜索请求量规模为2033.8亿次,年同比增长35.7%。自2007年中国列于全球搜索请求量首位以来,其在全球市场的领先优势持续强化:2007年至2009年,中国搜索请求量规模在全球请求量规模中占比分别为15.6%、19.7%和20.6%。折叠竞争格局双寡头特征依旧,建议
运营商外延竞争边界2009年中国搜索引擎市场双寡头特征加剧,营收方面,百度、谷歌二者营收份额之和为96.2%;流量方面,百度谷歌网页搜索请求量份额之和达94.9%,基本垄断中国搜索引擎市场。艾瑞建议领先通用搜索引擎运营商,在维持通用搜索市场的既得优势
的同时,重视来自广义搜索市场的潜在竞争。折叠编辑本段语言判断人们喜欢以他们所知道的语言列出的搜索结果,这对搜索营销人员是十分重要的。当一个搜索者输入上面图中的搜索请求时,只有用中文写的网页将被显示在搜索结果里面。在
有些国家,例如日本和中国,大部分搜索者想要结果限制在母语上。但是在其他地方例如瑞典,搜索可以采用瑞典语和英语来进行。不同国家的搜索者有不同的语言偏好。对搜索营销人员而言,重要的是搜索引擎知道网页所使用的语言,如果网页没能被正确地识别,可能就会从
本应发现它的搜索者面前消失,从而降低你的引荐访问。那么搜索引擎是怎样判断网页所使用的语言呢?这里有很多不同的方法:折叠语言meta标签很多网页通过一个HTML标签来表明网页使用的语言,例如<METAhttp-
equiv=”content-language”content="ja">表示使用的是日语,看起来简单,搜索蜘蛛程序读取标签,于是搜索引擎知道是什么语言了。但是相对多的语言meta标签是完全错误的,没有标签,句法错误,以及语言编码错误等等。搜索引擎确实查看这些标签,但是它们很少只从这些
标签来判定网页的语言。折叠字符编码计算机文件(包括HTML网页)需要“对译本(Key)”正确翻译文件中的字符(字母,数字等等)。这种对译本被称为字符编码。由网页中meta标签里声明,例如<METAhttp-equiv=conten
t-typecontent="text/html;charset=GBK">。网站浏览器和搜索蜘蛛程序假定网页按照西方语言编码,因此使用这些语言写的网页不需要这个标签。为了浏览器显示正确,亚洲、阿拉伯和古代斯拉夫语的文本确实需要这个标签。因此
,当搜索引擎看到针对这些语言的表情,它对正确显示网页的语言有了很高的保证。折叠内容分析搜索引擎通过研究内容中的字符模式来最终判定网页的语言,哪怕是短到只有两句话的网页,内容分析的精确度也非常高。Meta标签只有在内容分析后还不确定的情
况下才被使用。多数情况下,搜索引擎会自行正确地判断网页的内容,对于只有很少几个词的网页,要保证网页被正确识别,正确的编码语言和meta语言标签很重要。折叠编辑本段技术发展搜索引擎经过几年的发展和摸索,越来越贴近人们的需求,搜索引擎的技术也得到了很大的发展。搜索引擎的最新技术发展包括以下几个方面:
提高搜索引擎对用户检索提问的理解为了提高搜索引擎对用户检索提问的理解,就必须有一个好的检索提问语言,为了克服关键词检索和目录查询的缺点,现在已经出现了自然语言智能答询。用户可以输入简单的疑问句,比如“howcankillvir
usofcomputer?”。搜索引擎在对提问进行结构和内容的分析之后,或直接给出提问的答案,或引导用户从几个可选择的问题中进行再选择。自然语言的优势在于,一是使网络交流更加人性化,二是使查询变得更加方便、直接、有效。就以上面的例子来讲,如果用关键词查
询,多半人会用“virus”这个词来检索,结果中必然会包括各类病毒的介绍、病毒是怎样产生的等等许多无效信息,而用“howcankillvirusofcomputer?”,搜索引擎会将怎样杀病毒的信息提供给用户,提高了检索效率。对检索结
果进行处理1、基于链接评价的搜索引擎基于链接评价的搜索引擎的优秀代表是Google,它独创的“链接评价体系”是基于这样一种认识,一个网页的重要性取决于它被其它网页链接的数量,特别是一些已经被认定是“重要”的网页的链接数量。这种评价体制与《科技引文索引》的思路非常相似,但
是由于互联网是在一个商业化的环境中发展起来的,一个网站的被链接数量还与它的商业推广有着密切的联系,因此这种评价体制在某种程度上缺乏客观性。2、基于访问大众性的搜索引擎基于访问大众性的搜索引擎的代表是directhit,
它的基本理念是多数人选择访问的网站就是最重要的网站。根据以前成千上万的网络用户在检索结果中实际所挑选并访问的网站和他们在这些网站上花费的时间来统计确定有关网站的重要性排名,并以此来确定哪些网站最符合用户的
检索要求。因此具有典型的趋众性特点。这种评价体制与基于链接评价的搜索引擎有着同样的缺点。3、去掉检索结果中附加的多余信息有调查指出,过多的附加信息加重了用户的信息负担,为了去掉这些过多的附加信息,可以采用用户定制
、内容过滤等检索技术。确定搜索引擎信息搜集范围1、垂直主题搜索引擎网上的信息浩如烟海,网络资源以十倍速的增长,一个搜索引擎很难收集全所有主题的网络信息,即使信息主题收集得比较全面,由于主题范围太宽,很难将各主题都做得精确而又专业,使得检索结果垃圾太多。这样以来,
垂直主题的搜索引擎以其高度的目标化和专业化在各类搜索引擎中占据了一系席之地,比如象股票、天气、新闻等类的搜索引擎,具有很高的针对性,用户对查询结果的满意度较高。作者认为,垂直主题有着极大的发展空间。2、非www信息的搜索提供
FTP等类信息的检索3、多媒体搜索引擎多媒体检索主要包括声音、图像、视频的检索。关于图片搜索引擎的原理,《浅谈图片搜索引擎的实现》中提出了具有跨时代意义设计思路。提供更优化的检索结果1、纯净搜索引擎这类搜索引擎没有自己的信息采集系统,利用别人现有的索引数据库,主要关注检索的理
念、技术和机制等。2、元搜索引擎现在出现了许多的搜索引擎,其收集信息的范围、搜索机制、算法等都不同,用户不得不去学习多个搜索引擎的用法。每个搜索引擎平均只能涉及到整个www资源的30-50%(searchenginewatch数据),这样导致同一个搜索请求在不同搜索引擎中获得的查询
结果的重复率不足34%,而每一个搜索引擎的查准率不到45%。元搜索引擎(metasearchengining)是将用户提交的检索请求到多个独立的搜索引擎上去搜索,并将检索结果集中统一处理,以统一的格式提供给用户,因此有搜索引擎之上的搜索引擎之称。它的主要精力放在提高搜索速度、智能化处
理搜索结果、个性搜索功能的设置和用户检索界面的友好性上,查全率和查准率都比较高。目前比较成功的元搜索引擎有metacrawler、dopile、ixquick、搜客等。3、集成搜索引擎集成搜索引擎(All-in-OneSearchPage),亦称为“多引擎同步检索系统”(如百度)是在一个WWW页面
上链接若干种独立的搜索引擎,检索时需点选或指定搜索引擎,一次检索输入,多引擎同时搜索,用起来相当方便。集成搜索引擎无自建数据库,不需研发支持技术,当然也不能控制和优化检索结果。但集成搜索引擎制作与维护技术简单,可随时对所链接的搜索引擎进行增删调整和及时更新,尤其
大规模专业(如FLASH、MP3等)搜索引擎集成链接,深受特定用户群欢迎。4、垂直搜索引擎垂直搜索引擎是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务
。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。折叠搜索引擎的主题分类网页音乐(翻唱MP3)影视(电影电视)视频播客软件BT下载硬件图片壁纸相册小说文学文档(论文述职报告思想汇报演
讲稿入党申请书作文个人简历毕业论文法律论文经济论文教育论文会计论文计算机论文毕业论文集情书调查报告求职信商业计划书实习报告就职演说自荐信企划方案企业管理年终总结)新闻(资讯)百科(知识经验)教育人物学校专
业论坛社区博客词典翻译地图动漫Flash游戏娱乐笑话汽车家电手机广告购物商业黄页房产招聘财经股票基金法律国学图书政府目录学术代码公交实用查询等几十个分类。折叠搜索引擎的最后一步10年前我们要查阅资料,请教问题,更多想到的是请教专家,图书管
查阅等传统方式。常常为了一个简单的问题而到处寻师,在图书馆翻着类似我的电脑桌抽屉里的检索卡片,苦苦寻找。曾几何时,互联网的普及与兴起,搜索引擎的出现,逐渐改变着我们的生活习惯和思维方式。很多问题“baidu一下,你就知道。”就像这里用的“曾几何时”这一词,
中文不好的我只有模糊的理解,还以为有“曾经”的意思,想用为第一句。于是百度知道搜索了一下,出自宋"王安石《祭盛侍郎文》:“补官扬州,公得谢归。曾几何时,讣者来门。”才知是才过了不久的意思。搜索引擎(searchengine)是一个系统,能从大量信息中找到所需的
信息,提供给用户。互联网出现到现今,信息量可以说成密指数的增长,大量信息就像Google的原本含义一样“1的后面跟着100个0”,这个数比宇宙所有的基本粒子的数量总和还要大。在这浩如烟海的信息中怎么才能找到自己需要的信息呢?搜
索引擎就像一只神奇的手,从杂乱的信息中抽出一条清晰的检索路径。事物的发展往往遵循着合久必分,分久必合的规律,每一次的合与分都是代表着更高级更先进。同样搜索引擎从最初的Archie可以用文件名查找整个互联网中FTP文件
的系统,发展到Yahoo早期一种手工录入的分行业的目录检索。随着搜索技术的发展,元标记搜索、全文搜索重新又把整个互连网的信息整合起来提供给用户,目前的Baidu、Google提供的就是一种整个互联网的全文搜索,这种整合信息的搜索也称为水平搜索。这种水平全文搜索固然可以把
网络中的所有相关信息提供给用,但这种“所有”不代表着是用户所需的“所有”,往往夹杂着许多垃圾信息。问题出现就伴随着去解决,如果平常使用搜索引擎比较全面,你会发现Baidu、Goolge都有了“更多”的选项,其中出现了大学搜索、新闻搜索、图书搜索、图片搜索等等这些专业
化,行业化的搜索,也称为垂直搜索。当前垂直搜索正在逐渐走向丰富化、专业化、行业化,将越来越满足人们的搜索需求。比如很多人在搜索问题时会到百度知道里搜索,因为那里更有针对性;搜索天气会到天气搜索中等等。那么搜索引擎的下一步发展是什么呢?让我
们回想一下搜索引擎的定义:一个系统,能从大量信息中找到所需的信息,提供给用户。根据技术的不断发展和事物规律畅想一下,垂直搜索发展到一定程度会出现信息的单一专业化太强,整体信息综合化不好,而人们需要的不但要有专业信息,同样也要有整体联想信息。随着人工智能、神经网络、网格计算等搜索技术的发展,我们
又将有一个能整合互联网信息,智能的提供用户确实所“需”的信息,而不简单只是所“要”的信息,因为很多时候搜索时,自己都不知道要什么。再回的现在的搜索引擎,它就像一只神奇的手,从杂乱的信息中抽出一条清晰的检索路径。这个
引擎提供给用户的最后一步是什么?是一条清晰的检索路径。好的,注意这是一条检索路径,在这条路径的上的检索和信息提取是什么呢,是我们的阅读和大脑的判断。也就是做搜索引擎的最后一步是我们的大脑。得到的这条路径清晰但也并不简短,需要我们进行快速的浏览,呵呵,绕来绕去,得出一个
结论,快速阅读也是搜索引擎中的一部分。随着搜索市场竞争的白热化,搜索引擎不仅开始深挖自己的战壕,还开始打起了口水战,而山寨搜索引擎在高举着“整合”的大旗,开始大摇大摆地进入这个本来只有巨头垄断的市场。国人充分发挥着其无比的想象力,准备让国内的互联网“步入搜索新时代”
。下面就让我们看看什么是山寨搜索引擎“百google度”-baigoogledu最早的山寨搜索引擎,曾经名噪一时。最早确定了山寨搜索引擎的模式,而且访问量很高,但功能简单,而且让用户需要不停的两边拖拉才能看到完整的结果。“百谷虎”-baigoohoo由于某家
新闻媒体的报道,最近声名大振,高举着“山寨”大旗,让国人开始了解什么是山寨搜索引擎,名字极富创意。可惜由于搜索结果被并排挤在一起,似乎没有什么实际使用价值。“山寨文化”在每个人的心目中可能都有着不同的感觉,但随着
这股风越刮越烈,可见草根对“山寨”的内涵还是有相当的认同,百度和谷歌的嘴仗打的不亦热乎,都指责对方结果不公正,山寨搜索却硬要把这两个冤家放在一起。也许很多人对“山寨搜索”嗤之以鼻,但是对于普通网民来说,是谁的搜索并不重要,是我们需要的结果
才是最重要的么。如果是你,你会选择谁呢?搜索引擎优化(SearchEngineOptimization,简称SEO)搜索引擎优化即SearchEngineOptimization,用英文描述是tousesometechnicstomakeyourwebsitein
thetopplacesinSearchEnginewhensomebodyisusingSearchEnginetofindsomething,翻译成中文就是“搜索引擎优化”,一般可简称为搜索优化。与之相关的搜索知
识还有SearchEngineMarketing(搜索引擎营销),SearchEnginePositioning(搜索引擎定位)、SearchEngineRanking(搜索引擎排名)等。折叠编辑本段未来展望随着互
联网的发展,网上可以搜寻的网页变得愈来愈多,而网页内容的质素亦变得良莠不齐,没有保证。所以,未来的搜索引擎将会朝着知识型搜索引擎的方向发展,期以为搜寻者提供更准确及适用的资料。目前,网上的百科全书如雨后春笋般发展起来;另一方面,近年来亦有不少公司尝试在搜寻方面改进,务求更符合用户的要求。当中诸如C
opernicAgent之类的搜寻代理就是其中之一。在台湾,威知资讯(WebGenie)是利用文字探勘(TextMining)技术发展搜寻引擎产品的公司,利用人工智能算法,可达成目前搜寻引擎所缺乏的简易人机互动模式,诸如关联字提
示、动态分类字提示等[1],算是较另类的搜寻引擎产品。折叠搜索关键词提炼选择搜索关键词的原则是,首先确定你所要达到的目标,在脑子里要形成一个比较清晰概念,即我要找的到底是什么?是资料性的文档?还是某种产品或服务?然后再分析这些信息都有些什么共性,以及区别于其他同类信息的特性,最
后从这些方向性的概念中提炼出此类信息最具代表性的关键词。如果这一步做好了,往往就能迅速的定位你要找的东西,而且多数时候你根本不需要用到其他更复杂的搜索技巧。折叠细化搜索条件你给出的搜索条件越具体,搜索引擎返回的结果也会越精确。比方说你想查找有关电脑冒险游戏方面
的资料,输入game是无济于事的。computergame范围就小一些,当然最好是敲入computeradventuregame,返回的结果会精确得多。此外一些功能词汇和太常用的名词,如对英文中的“and”、“how”、“wh
at”、“web”、“homepage”和中文中的“的”、“地”、“和”等等搜索引擎是不支持的。这些词被称为停用词(StopWords)或过滤词(FilterWords),在搜索时这些词都将被搜索引擎忽略。折叠用好搜索逻辑命
令搜索引擎基本上都支持附加逻辑命令查询,常用的是“+”号和“-”号,或与之相对应的布尔(Boolean)逻辑命令AND、OR和NOT。用好这些命令符号可以大幅提高我们的搜索精度。折叠精确匹配搜索除利用前面提到的逻辑命令来缩小查询范围外,还可使用""引号(注意为英
文字符。虽然现在一些搜索引擎已支持中文标点符号,但顾及到其他引擎,最好养成使用英文字符的习惯)来进行精确匹配查询(也称短语搜索)。折叠特殊搜索命令●标题搜索多数搜索引擎都支持针对网页标题的搜索,命令是“title:”,
在进行标题搜索时,前面提到的逻辑符号和精确匹配原则同样适用。●网站搜索此外我们还可以针对网站进行搜索,命令是“site:”(Google)、“host:”(AltaVista)、“url:”(Infoseek)或“domain:”(HotBot)。●链接
搜索在Google和AltaVista中,用户均可通过“link:”命令来查找某网站的外部导入链接(inboundlinks)。其他一些引擎也有同样的功能,只不过命令格式稍有区别。你可以用这个命令来查看是谁以及有多少网站与你做了链
接。折叠编辑本段使用技巧折叠1、简单查询在搜索引擎中输入关键词,然后点击“搜索”就行了,系统很快会返回查询结果,这是最简单的查询方法,使用方便,但是查询的结果却不准确,可能包含着许多无用的信息。折叠2、双引号用("")给要查询的关键词加上双引号(半角,以下要加的其它符号同此),
可以实现精确的查询,这种方法要求查询结果要精确匹配,不包括演变形式。例如在搜索引擎的文字框中输入“电传”,它就会返回网页中有“电传”这个关键字的网址,而不会返回诸如“电话传真”之类网页。折叠3、使用加号(+)在关键词的前面使用加号,也就等
于告诉搜索引擎该单词必须出现在搜索结果中的网页上,例如,在搜索引擎中输入“+电脑+电话+传真”就表示要查找的内容必须要同时包含“电脑、电话、传真”这三个关键词。折叠4、使用减号(-)在关键词的前面使用减号
,也就意味着在查询结果中不能出现该关键词,例如,在搜索引擎中输入“电视台-中央电视台”,它就表示最后的查询结果中一定不包含“中央电视台”。折叠5、通配符(*和?)通配符包括星号(*)和问号(?),前者表示匹配的数量不受限制,后者匹配的字符数要
受到限制,主要用在英文搜索引擎中。例如输入“computer*”,就可以找到“computer、computers、computerised、computerized”等单词,而输入“comp?ter”,则只能找到“computer、compater、compete
r”等单词。折叠6、使用布尔检索所谓布尔检索,是指通过标准的布尔逻辑关系来表达关键词与关键词之间逻辑关系的一种查询方法,这种查询方法允许我们输入多个关键词,各个关键词之间的关系可以用逻辑关系词来表示。and,称为逻辑“与”,用and进行连接,表示它所连接的两个词必须同时出现在查询
结果中,例如,输入“computerandbook”,它要求查询结果中必须同时包含computer和book。or,称为逻辑“或”,它表示所连接的两个关键词中任意一个出现在查询结果中就可以,例如,输入“computerorbook”,就要求查询结果中可以只有computer,或
只有book,或同时包含computer和book。not,称为逻辑“非”,它表示所连接的两个关键词中应从第一个关键词概念中排除第二个关键词,例如输入“automobilenotcar”,就要求查询的结果中包含automobile
(汽车),但同时不能包含car(小汽车)。near,它表示两个关键词之间的词距不能超过n个单词。在实际的使用过程中,你可以将各种逻辑关系综合运用,灵活搭配,以便进行更加复杂的查询。折叠7、使用括号当两个关键词用另外一种操
作符连在一起,而你又想把它们列为一组时,就可以对这两个词加上圆括号。折叠8、使用元词检索大多数搜索引擎都支持“元词”(metawords)功能,依据这类功能用户把元词放在关键词的前面,这样就可以告诉搜索引擎你想要检索的内容具有哪些明确的特征。例如,你在搜索引擎中输入“title:清华大
学”,就可以查到网页标题中带有清华大学的网页。在键入的关键词后加上“domainrg”,就可以查到所有以org为后缀的网站。其他元词还包括:image:用于检索图片,link:用于检索链接到某个选定网站的页面,
URL:用于检索地址中带有某个关键词的网页。折叠9、区分大小写这是检索英文信息时要注意的一个问题,许多英文搜索引擎可以让用户选择是否要求区分关键词的大小写,这一功能对查询专有名词有很大的帮助,例如:Web专指万维网或环球网,而web则表示蜘蛛网。折叠编辑本段现状搜索引擎诞生到现在
已经有几十年历史,期间搜索技术一直在不断的变化,从最初的目录式搜索、到关键词搜索,以及正在发展的语音搜索、图片搜索等,搜索引擎在不断进化中。如果谈及搜索引擎的下一个趋势时,个性化搜索引擎无疑是最受关注的方向,并且将成为搜索引擎的未来
。近些年来,谷歌、微软必应、中搜等搜索引擎的技术变化透漏出一些端倪,个性化搜索正成为这些搜索引擎研究的方向,争相开发出各种个性化的搜索平台和功能,满足用户不同的搜索需求。现任雅虎总裁玛丽莎·梅耶尔在谈及搜索引擎未来时表示:“每天网上爆发的信息已经超过了用户的接受范围,
因人而异的个性化搜索才能帮助用户快速、准确的找到所需信息。”中搜总裁陈沛在多个场合提到,当前搜索引擎提供的搜索结果基本相近,内容同质化。其中许多结果内容是用户根本不需要的,未来的搜索一定是满足用户的不同需求
,搜索引擎将成为个性化平台。当前的搜索引擎尽管还能给用户提供一些有用的东西,但是因不同地区、个人兴趣习惯、社交关系等因素去搜索时,得到的搜索结果却不尽人意,这是目前搜索引擎需要改进的地方。折叠编辑本段最新消息6月7日消息,据TechCrunch报道,苹果公司已经收
购了硅谷社交搜索创业公司Spotsetter,交易价格未知。Spotsetter成立于2013年,是一个基于Google地图的社交搜索引擎,能够分析用户的社交圈,并为用户提供个性化的地点(如旅游地点和餐馆)推荐服务,致力于解决所谓的“wheretogo”问题。搜索引擎外界认为,苹果收
购Spotsetter是为了获得它的推荐技术,该技术可以被添加到苹果Maps中。虽然Spotsetter的许多员工,——包括其共同创始人、前谷歌(微博)Maps工程师斯蒂芬·谢(StephenTse)和约翰尼·李(J
ohnnyLee)——已经搬到苹果总部办公,但这并不能算是一次严格意义上的所谓收购。据悉,Spotsetter公司已经为其推荐算法提交专利申请,这可能是苹果真正感兴趣的东西。此前,Spotsetter在创业融资中筹集了不到150万美元资金,由此推断苹果的收购价格应该不过是数千万美元。六天前,约
翰尼在一篇博客文章中宣布Spotsetter将从应用商店中下架,但他同时表示,他和他的团队“在地点搜索和个性化推荐服务领域仍然具有很大的梦想,并期待未来在该领域取得巨大进步。”折叠编辑本段发展搜索引擎正从单一式的页面搜索逐渐向集合式、
延展性的方向发展,人性化的界面设计、功能性的拓展、资源的整合正给我们搜索引擎注入更多的发展契机。最有代表性意义的是一款艾优搜索引擎正是集合搜索引擎发展的代表之作。