- 自制AI图像搜索引擎
- 明恒毅
- 166字
- 2020-06-27 17:47:25
1.2 文本搜索引擎的结构与实现
目前,基于文本信息的搜索引擎虽然还有一定的提升空间,但其工作原理已经相对稳定,基本结构也已趋于成熟。文本搜索引擎基本可以分为抓取部分、预处理部分、索引部分、搜索部分以及用户接口,如图1-1所示。
![](https://epubservercos.yuewen.com/BF67CE/16568261905809406/epubprivate/OEBPS/Images/5.jpg?sign=1739653121-RItIW6c8eG2RfsDY3xkWfgJiDNCo2CTM-0-1ee8580bb166da2d549449c56be55906)
图1-1 文本搜索引擎结构
由于抓取部分不是本书所讨论的内容,故不做详细介绍。下面来着重介绍一下文本数据预处理、索引及搜索。
目前,基于文本信息的搜索引擎虽然还有一定的提升空间,但其工作原理已经相对稳定,基本结构也已趋于成熟。文本搜索引擎基本可以分为抓取部分、预处理部分、索引部分、搜索部分以及用户接口,如图1-1所示。
图1-1 文本搜索引擎结构
由于抓取部分不是本书所讨论的内容,故不做详细介绍。下面来着重介绍一下文本数据预处理、索引及搜索。