admin管理员组

文章数量:1027126

基于Boost库、Jsoncpp、cppjieba、cpp

项目背景

目前我们常用的搜索引擎有Google、百度、360等,这些搜索引擎都是超大型超完善的全网搜索,而本项目Boost搜索引擎只是一个非常简单的站内搜索。

比较维度

全网搜索

站内搜索

搜索范围与数据来源

覆盖整个互联网,数据来源广泛,需搜索引擎爬虫抓取收录网页

限定在特定网站内部,数据仅来源于该网站自身内容

搜索效率

范围广、数据量大,检索复杂,速度相对较慢,结果筛选耗时

搜索范围小,速度更快,可快速定位信息

可控性

用户和网站管理者无法干涉搜索引擎算法,搜索结果不可控

网站管理者可优化搜索功能,根据需求调整搜索算法等,具有可控性

索引构建

需构建庞大复杂的索引系统处理海量数据,技术难度高

针对特定网站内容和数据结构优化,索引构建相对简单且更具针对性

为什么选做Boost的搜索引擎呢? 作为C++选手,相信大家都浏览过Boost官网,而我们在2023年之前浏览Boost官网时是没有搜索功能的,虽然自从2023年起新增了搜索功能,但这之前给我们的不太好的浏览体验可能还是耿耿于怀,所以本项目选做Boost搜索引擎,算是弥补之前没有的遗憾吧(虽然肯定没有现在官网提供的好用

基于Boost库、Jsoncpp、cppjieba、cpp

项目背景

目前我们常用的搜索引擎有Google、百度、360等,这些搜索引擎都是超大型超完善的全网搜索,而本项目Boost搜索引擎只是一个非常简单的站内搜索。

比较维度

全网搜索

站内搜索

搜索范围与数据来源

覆盖整个互联网,数据来源广泛,需搜索引擎爬虫抓取收录网页

限定在特定网站内部,数据仅来源于该网站自身内容

搜索效率

范围广、数据量大,检索复杂,速度相对较慢,结果筛选耗时

搜索范围小,速度更快,可快速定位信息

可控性

用户和网站管理者无法干涉搜索引擎算法,搜索结果不可控

网站管理者可优化搜索功能,根据需求调整搜索算法等,具有可控性

索引构建

需构建庞大复杂的索引系统处理海量数据,技术难度高

针对特定网站内容和数据结构优化,索引构建相对简单且更具针对性

为什么选做Boost的搜索引擎呢? 作为C++选手,相信大家都浏览过Boost官网,而我们在2023年之前浏览Boost官网时是没有搜索功能的,虽然自从2023年起新增了搜索功能,但这之前给我们的不太好的浏览体验可能还是耿耿于怀,所以本项目选做Boost搜索引擎,算是弥补之前没有的遗憾吧(虽然肯定没有现在官网提供的好用

本文标签: 基于Boost库Jsoncppcppjiebacpp