基于Boost库、Jsoncpp、cppjieba、cpp

项目背景目前我们常用的搜索引擎有Google、百度、360等,这些搜索引擎都是超大型超完善的全网搜索,而本项目Boost搜索引擎只是一个非常简单的站内搜索。比较维度全网搜索站内搜索搜索范围与数据来源覆盖整个互联网,数据来源广泛,需搜索引擎爬

基于Boost库、Jsoncpp、cppjieba、cpp

项目背景

目前我们常用的搜索引擎有Google、百度、360等,这些搜索引擎都是超大型超完善的全网搜索,而本项目Boost搜索引擎只是一个非常简单的站内搜索。

比较维度

全网搜索

站内搜索

搜索范围与数据来源

覆盖整个互联网,数据来源广泛,需搜索引擎爬虫抓取收录网页

限定在特定网站内部,数据仅来源于该网站自身内容

搜索效率

范围广、数据量大,检索复杂,速度相对较慢,结果筛选耗时

搜索范围小,速度更快,可快速定位信息

可控性

用户和网站管理者无法干涉搜索引擎算法,搜索结果不可控

网站管理者可优化搜索功能,根据需求调整搜索算法等,具有可控性

索引构建

需构建庞大复杂的索引系统处理海量数据,技术难度高

针对特定网站内容和数据结构优化,索引构建相对简单且更具针对性

为什么选做Boost的搜索引擎呢? 作为C++选手,相信大家都浏览过Boost官网,而我们在2023年之前浏览Boost官网时是没有搜索功能的,虽然自从2023年起新增了搜索功能,但这之前给我们的不太好的浏览体验可能还是耿耿于怀,所以本项目选做Boost搜索引擎,算是弥补之前没有的遗憾吧(虽然肯定没有现在官网提供的好用

发布者:admin,转转请注明出处:http://www.yc00.com/web/1747382459a4639713.html

相关推荐

  • 基于Boost库、Jsoncpp、cppjieba、cpp

    项目背景目前我们常用的搜索引擎有Google、百度、360等,这些搜索引擎都是超大型超完善的全网搜索,而本项目Boost搜索引擎只是一个非常简单的站内搜索。比较维度全网搜索站内搜索搜索范围与数据来源覆盖整个互联网,数据来源广泛,需搜索引擎爬

    2天前
    10

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信