摘要:随着互联网的发展和搜索技术的迭代更新,用户多元化的上网需求照进现实,社交、电商、博客等网络形态风靡, web2.0搜索技术推动信息社交化,国内互联网开始在即时通讯、电子商务、搜索引擎等底层技术服务上,与整个互联网世界脉络相通。搜索技术根植于连接信息,沟通万物的开放生态,正是基于其对信息获取的革命性突破,谷歌、微软必应、雅虎和百度等第一批互联网公司,都是从搜索引擎开始起步。

20年以来,世界经济由科技创新推动,创新主力军一直是互联网公司。搜索引擎作为改变人类知识获取能力的革命性产品,点击拇指大小的搜索框,便能检索到任何你感兴趣的信息,极大程度地降低了沟通成本,消弭了信息鸿沟,这在20年前是不可想象的。

搜索技术根植于连接信息,沟通万物的开放生态,正是基于其对信息获取的革命性突破,谷歌、微软必应、雅虎和百度等第一批互联网公司,都是从搜索引擎开始起步。

搜索引擎风云20年:不乏挑战者,少有幸存者

时代更迭,搜索引擎改变世界

回望中国互联网发展史,搜索技术的进化近乎主导着中国互联网行业的发展,互联网的web1.0时代其实是web1.0搜索技术发展推动信息门户建立,而创造的一个“门户丛生”的网络世界。

1996年成立的搜狐公司是最早参与网络信息分类导航的网站,曾一度享有“出门找地图,上网找搜狐的”美誉,新浪、网易也纷纷跟进效仿。由于其人工分类提交的局限性,信息分类模式逐渐被基于robot自动抓取智能分类的信息技术取代。

四年后,中国真正意义上的搜索引擎面世——百度搜索,这个由超链分析专利发明人、前Infoseek资深工程师李彦宏和好友徐勇共同创建的中文搜索,是在中文领域第一个开始使用ppc经营模式,逐渐支持网页信息检索,图片,Flash,音乐等多媒体信息的检索,彻底改变了十三亿中国人获取信息的能力和方式。

从web1.0到web2.0、web3.0的过程中,中国网民经历了内容匮乏,内容充足和到如今内容过载,搜索引擎解决了用户高效 “获取有效信息”的痛点,也为更多网站提供流量入口。

随着互联网的发展和搜索技术的迭代更新,用户多元化的上网需求照进现实,社交、电商、博客等网络形态风靡, web2.0搜索技术推动信息社交化,国内互联网开始在即时通讯、电子商务、搜索引擎等底层技术服务上,与整个互联网世界脉络相通。

当算法不断精进,算力得以释放,人工智能开始登上互联网舞台C位,融为日常生活的一部分,图片搜索和语音搜索代替了九宫格键盘,智能化搜索实现了对图片和声音的直接发问:这张图片上的花叫什么?图片即答案,声音即答案,web3.0搜索技术加速了智能化进程。搜索技术正以狂飙突进之势改变着人们的日常生活和社会面貌。

大浪淘沙,搜索技术门槛之痛

尽管搜索引擎的用户界面看起来简单,其极高的技术门槛却把众多企业都拒之门外。

从最早期搜索技术的摸索发展到现在,纵观国内外市场,谷歌、雅虎、腾讯、360都挑战过搜索领域,但大浪淘沙,现在留下的所剩无几。

早期的谷歌是第一个进军中国搜索市场的巨头,由于对中国内容生态的水土不服,谷歌于2010年选择退出了中国市场。投怀阿里的雅虎即使在马云掷下“三年内,在中国,搜索就是雅虎,雅虎就是搜索” 的豪言壮语后,也没能起死回生,由于不合时宜的大刀阔斧的改革、举棋不定的调整,雅虎走上了下坡路。曾经请来吴军的腾讯,即使豪掷了与当年谷歌一样的资金投入研发,也没能挽救腾讯搜索产品“搜搜”的末途宿命。

如今但凡跟内容搭边的产品都有搜索功能,但这不意味着它就能称作搜索引擎。

淘宝、优酷、知乎等网页内置的搜索功能,仅仅停留在自家内容的垂直搜索领域,换句话讲就是站内搜索,基于站内资源搭建的检索入口,是一项最基础的搜索功能,尚达不到引擎这样的高度,搜索引擎承载的是数以亿万的网站入口。

搜索引擎市场向来不乏挑战者,但站在金字塔最顶端的始终都是那么几家。

引领未来,从“有框”搜索到“无框”搜索

但凡在技术一线待过的人都深知,搜索技术的核心,是诸多技术的基础。

搜索技术对大数据挖掘、自然语言处理和知识图谱构建要求颇高,得搜索技术者得天下的说法毫不夸张。

拿人工智能来说,目前扎根一线,专利满钵的还是谷歌、百度这一类搜索公司,这是因为AI技术与搜索技术算法逻辑是一脉相承的,搜索技术才是真技术垄断。

搜索技术二十年风雨,正经历了从试水期、爆发期到精耕期、成熟期。搜索技术第一个阶段解决的是效率问题,使用倒排索引解决匹配的效率,确保了基本的文字相关性;超链模型的创造和引入,大大提升搜索质量和结果匹配度,让搜索技术来到了爆发期;精耕期的搜索技术,一方面使用更复杂的规则和机器学习排序模型,综合考虑了用户的行为特征,另一方面,基于先进的自然语言处理技术,挖掘用户搜索行为,更易理解用户。

从“有框”搜索时代步入“无框”搜索时代,是搜索技术发展至今的全新形态,从纯文本搜索到图片和语音交互,语音识别、图像识别等AI技术得以应用到搜索引擎中,甚至像小程序这种服务类产品也被置入搜索结果内,达成了更精准的内容获取。未来,搜索技术还有更多可能性。

技术见顶,搜索引擎马太效应将愈发明显

尽管搜索技术正在不断进化,从内容分发走向服务分发,用户、内容与服务形成闭环,但搜索引擎的马太效应也开始显现。

一方面,电商、短视频、问答等领域的搜索引擎仅仅停留在站内搜索的水平,其核心技术也只在垂直搜索领域踟蹰难前。

另一方面,360搜索、神马搜索等仍在搜索市场苦苦挣扎的搜索引擎们,由于技术乏力,只能通过恶意篡改首页、流量劫持、产品捆绑等方式抢夺寥寥无几的市场份额。

对年初新近入局的头条搜索,以技术为傲的今日头条在其上线之初就四面楚歌,遭遇技术滑铁卢,大量用户发现其搜索产品直接大量盗用百度“TOP1产品”搜索结果。而近日据字节跳动发布的招聘启事透露,字节跳动搜索部门将推出“全网搜索”。

这个以支持今日头条、抖音、西瓜、火山、懂车帝等产品搜索功能的技术团队,能在搜索这条路上走多远,“全网搜索”最终会不会沦为又一个字节跳动全家桶的“站内搜索”,我们不得而知,唯一确定的是,搜索技术是创造了各种互联网场景的底层技术,掌握它的永远是多年深耕一线的少数派。

提出一个好问题,远远比回答一个好问题,更为重要。这是人类思辨能力断的普适经验,也正是搜索引擎方兴未艾,源源造血的根基所在。

搜索是底层技术的积累,而AI则是搜索技术引领未来的根本,技术能力跟不上的公司将被时代淘汰。 搜索引擎在过去20年一直引领互联网产业发展和世界变革,未来将接轨AI技术继续引领5G时代行业革新。无论是过去亦或现在,许多产品在搜索引擎这棵大树上“开枝散叶”,作为网络新物种的缔造者,它始终都是进行时。

相关文章