Oracle Text的体系架构-369IT编程

admin管理员组
文章数量:1130349

图1 Oracle Text的体系架构

　　以上面的体系架构图为基础，Oracle Text 索引文档时所使用的主要逻辑步骤如下：

　　（1）数据存储逻辑搜索表的所有行，并读取列中的数据。通常，这只是列数据，但有些数据存储使用列数据作为文档数据的指针。例如，URL_DATASTORE 将列数据作为 URL 使用。

　　（2）过滤器提取文档数据并将其转换为文本表示方式。存储二进制文档 (如 Word 或 Acrobat 文件) 时需要这样做。过滤器的输出不必是纯文本格式 -- 它可以是 XML 或 HTML 之类的文本格式。找了台服务器将磁力链接爬虫架设起来http://www.51bt(51搜索)大家可以看下。

　　（3）分段器提取过滤器的输出信息，并将其转换为纯文本。包括 XML 和 HTML 在内的不同文本格式有不同的分段器。转换为纯文本涉及检测重要文档段标记、移去不可见的信息和文本重新格式化。

　　（4）词法分析器提取分段器中的纯文本，并将其拆分为不连续的标记。既存在空白字符分隔语言使用的词法分析器，也存在分段复杂的亚洲语言使用的专门词法分析器。

　　（5）索引引擎提取词法分析器中的所有标记、文档段在分段器中的偏移量以及被称为非索引字的低信息含量字列表，并构建反向索引。倒排索引存储标记和含有这些标记的文档。图1 Oracle Text的体系架构

　　以上面的体系架构图为基础，Oracle Text 索引文档时所使用的主要逻辑步骤如下：

　　（1）数据存储逻辑搜索表的所有行，并读取列中的数据。通常，这只是列数据，但有些数据存储使用列数据作为文档数据的指针。例如，URL_DATASTORE 将列数据作为 URL 使用。

本文标签：架构体系 Oracle text

版权声明：本文标题：Oracle Text的体系架构内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://it.en369.cn/jiaocheng/1763854044a2969094.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

369IT编程

Oracle Text的体系架构

更多相关文章

[架构之路-159]-《软考-系统分析师》-10-系统分析-6-现有业务流程分析, 系统分析最核心的任务

终于，把 Oracle 给替了！金仓数据库的 “破局之战“：从老邓的 “六大不敢“ 到 2000 + 系统的平稳运行

windows上运行arm32架构的安卓模拟器

路由器IP地址体系深度解析：网关、网口与设备IP的关联逻辑

系统架构设计师【第11章】: 未来信息综合技术 (核心总结)

【超全超详细】2W字零基础小白黑客学习路线，知识体系（附学习路线图

oracle数据库中的回收站,Oracle回收站介绍

百度网盘Linux arm64架构版本，树莓派4B可用

服务器虚拟化安装杀毒软件,服务器虚拟化部署_服务器虚拟化部署架构

《架构真经：互联网技术架构的设计》大道至简

Oracle ORA-01157报错“cannot identifylock data file“解决

oracle ORA-01157: cannot identifylock data file 64

oracle 启动时出现ORA-01157: cannot identifylock data和ORA-01110: data file 错误

安装oracle用i5还是i7好,i7一定比i5强？买电脑陷阱你一定要注意了

Oracle Text的体系架构

Oracle中的临时表Temporary Table

B3U4 Text A Language Focus 共34词

oracle的nvl的使用,NVL函数使用时的注意事项和报错的原因

不可不知！AI应用架构师的虚拟购物架构指南

Windows10 安装oracle 11gR2 client 32位的方法

发表评论

推荐文章

报告视频录制：腾讯会议录屏+人像画中画特效

Acme CAD Converter 汉化版：CAD 批量转 PDF图片，永久升级实测

有的软件能联网，有的软件不能联网怎么办

2020年学计算机需要什么配置,2020年9月开学季，从实用到高端，力荐10款DIY电脑配置...

冥王峡谷装linux教程,Intel NUC冥王峡谷开箱及安装ESXi

热门文章

windows下载openjdk8（附赠安装包）

win10 linux 进入安全模式,详解win10如何进入安全模式

oracle12C使用expdp备份ORA-25153: Temporary Tablespace is Empty

android酷管家初始密码,酷派大神要酷管家密码才能恢复出厂设置

联通定制机酷派7728root方法（含工具）其它版本通用

跟大模型对话时 prompt 越礼貌越容易出好结果吗？为什么？

怎么清理缓存？电脑缓存瘦身这4个方法亲测有效！

红米路由器ac2100怎样设置ipv6_【路由刷机】红米小米 AC2100 Windows下刷Padavan固件小小白教程、升级固件...

CAJ转换为PDF+英语文献翻译

期货行情，英文翻译是什么？行情用 Quote 还是 Quotation ？（AI问答）

最新文章

Sublime 32位 激活码

windows下载安装远程桌面工具RealVNC-Server教程(RealVNC_E4_6_1版带注册码)

【亲测免费】 抖音直播伴侣推流密钥获取工具使用教程

【亲测免费】 Proxifer 安装包与注册码

Royal TSX许可证密钥(6.x后所有版本都可以用)

程序员刚毕业，先去大厂镀金还是先去小厂攒经验？

万象2008清空boss账户密码

【Tools】GitBook简明教程

oracle exadata celldisk 闪存盘受损导致性能下降

SDUT 2138 图结构练习——BFSDFS——判断可达性

WordPress get parent category taxonomy

Omit specific product categories from WooCommerce shortcode

Updating Posts table in database without overwriting user generated content

php - Use wp_get_recent_posts with search term

responsive - How to exclude an image size from the Wordpress srcset

Sublime 32位激活码

【亲测免费】抖音直播伴侣推流密钥获取工具使用教程