Oracle建立二进制文件索引的方法

正在看的ORACLE教程是:Oracle建立二进制文件索引的方法。Oracle text是Oracle的全文检索技术,是9i版本标准版和企业版的一部分。Oracle text使用标准的sql语言索引、查找、分析存储在oracle数据库、文件或者网络里的文本及文档。 Oracle text能进行关于文档的语言分析,使用多种方法查找文档,包括关键字、上下文查询、逻辑操作、模式匹配、混合主题查询、HTML/XML段落查找等方法。Oracle text在包含文本和结构化的关系属性的混合查询方面具有优越性。下面举例说明。

  现有文档表ZYCONTENT_TABLE为上载文件的存储表,二进制文件以BLOB类型存储在BLOB_CONTENT列中,oracle text技术提供为BLOB列中的二进制文本文件建立索引的方法,细节如下:

  一、准备工作

  文档表的模式为ZYFILEUP,文档表为ZYCONTENT_TABLE。文档表定义为:

  二、为拥有文档表的模式建立文本索引授权

  以system用户连接数据库,为ZYFILEUP授权。

  三、建立文档表在BLOB_CONTENT列上的索引

  以ZYFILEUP用户连接数据库,建立文本索引参考项

  建立索引

  四、索引同步和删除

  同步索引的两种方法:

  和

  删除索引的方法:

  五、索引功能介绍

  1.索引的文件类型

  Oracle text可以过滤以及从不同格式的文档里提取内容,它支持150多种文档格式,最常见的MS OFFICE文档、PDF文档等都可由Oracle text来检索。

  2.过滤器介绍

  对于纯文本文件格式,如TXT、HTML、XML等文件,使用空过滤器,即NULL_FILTER,对于二进制文件,使用INSO_FILTER过滤器,如果文档表的BLOB列中含有二进制文件和纯文本文件,也要用INSO_FILTER过滤器,但最好是把纯文本和二进制文件分开存储和索引。Oracle text还提供包来从二进制文件中提取文本到纯文本文件中。

  3.词典

  可以定制不同语言的词典,该词典含有同意词和词的级别关系。Oracle text可以提供多语言的最优特性以支持跨越西方语言、日语、朝鲜语、传统和简体中文所写的文档查找。

  六、文本查询语句格式

  contains函数提供强大的查询功能,"与"、"或"关系,相近(near ;)和排除(not ~)等功能,更方便的是它还可以根据某一关键词查询不同语种的文本,当然,这要事先设定词典。

  七、实际应用中的问题

  在我的实际应用中,最常用的是使用Oracle text对Word、Excel、PowerPoint、HTML、PDF等格式的中文文档进行索引,但我发现,无论使用INSO_FILTER还是NULL_FILTER,无论使用BASIC_LEXER还是CHINESE_LEXER,都不能检索RTF格式的文本文档,我在win2000,XP下试验,都没成功,不知什么原因。总体来说,Oracle text的文本检索功能还是相当出色的,它甚至不需要文本文件存储在数据库里,即使存储在操作系统的文件目录里,Oracle text也能在数据库里为文件建立索引。

(0)

相关推荐

  • Oracle中如何把表和索引放在不同的表空间里

    因为:1)提高性能:尽量把表和索引的表空间存储在不同在磁盘上,把两类不同IO性质的数据分开放,这样可以提高磁盘的IO总体性能: 2)便于管理:试想一下,如果索引的数据文件损坏,只要创建索引即可,不会引起数据丢失的问题. 下面语句用于移动索引的表空间: 复制代码 代码如下: alter index INDEX_OWNER.INDEX_NAME rebuild tablespace NEW_TBS; 也可以利用以下语句获得某个schema下移动索引表空间的所有语句: 复制代码 代码如下: selec

  • Oracle索引(B*tree与Bitmap)的学习总结

    在Oracle中,索引基本分为以下几种:B*Tree索引,反向索引,降序索引,位图索引,函数索引,interMedia全文索引等,其中最常用的是B*Tree索引和Bitmap索引.(1).与索引相关视图查询DBA_INDEXES视图可得到表中所有索引的列表:访问USER_IND_COLUMNS视图可得到一个给定表中被索引的特定列.(2).组合索引概念当某个索引包含有多个已索引的列时,称这个索引为组合(concatented)索引.注意:只有在使用到索引的前导索引时才可以使用组合索引(3).B*T

  • oracle 索引不能使用深入解析

    较典型的问题有:有时,表明明建有索引,但查询过程显然没有用到相关的索引,导致查询过程耗时漫长,占用资源巨大,问题到底出在哪儿呢?按照以下顺序查找,基本上能发现原因所在. 查找原因的步骤 首先,我们要确定数据库运行在何种优化模式下,相应的参数是:optimizer_mode.可在svrmgrl中运行"showparameteroptimizer_mode"来查看.ORACLEV7以来缺省的设置应是"choose",即如果对已分析的表查询的话选择CBO,否则选择RBO.

  • oracle索引介绍(图文详解)

    对于数据库来说,索引是一个必选项,但对于现在的各种大型数据库来说,索引可以大大提高数据库的性能,以至于它变成了数据库不可缺少的一部分. 索引分类:逻辑分类single column or concatenated  对一列或多列建所引unique or nonunique 唯一的和非唯一的所引,也就是对某一列或几列的键值(key)是否是唯一的.Function-based  基于某些函数索引,当执行某些函数时需要对其进行计算,可以将某些函数的计算结果事先保存并加以索引,提高效率. Doman 

  • Oracle CBO优化模式中的5种索引访问方法浅析

    本文主要讨论以下几种索引访问方法: 1.索引唯一扫描(INDEX UNIQUE SCAN) 2.索引范围扫描(INDEX RANGE SCAN) 3.索引全扫描(INDEX FULL SCAN) 4.索引跳跃扫描(INDEX SKIP SCAN) 5.索引快速全扫描(INDEX FAST FULL SCAN) 索引唯一扫描(INDEX UNIQUE SCAN) 通过这种索引访问数据的特点是对于某个特定的值只返回一行数据,通常如果在查询谓语中使用UNIQE和PRIMARY KEY索引的列作为条件的

  • Oracle关于重建索引争论的总结

    索引重建是一个争论不休被不断热烈讨论的议题.当然Oracle官方也有自己的观点,我们很多DBA也是遵循这一准则来重建索引,那就是Oracle建议对于索引深度超过4级以及已删除的索引条目至少占有现有索引条目总数的20% 这2种情形下需要重建索引.近来Oracle也提出了一些与之相反的观点,就是强烈建议不要定期重建索引.本文是参考了1525787.1并进行相应描述. 1.重建索引的理由 a.Oracle的B树索引随着时间的推移变得不平衡(误解)     b.索引碎片在不断增加     c.索引不断增

  • Oracle数据库中建立索引的基本方法讲解

    怎样建立最佳索引? 1.明确地创建索引 create index index_name on table_name(field_name) tablespace tablespace_name pctfree 5 initrans 2 maxtrans 255 storage ( minextents 1 maxextents 16382 pctincrease 0 ); 2.创建基于函数的索引 常用与UPPER.LOWER.TO_CHAR(date)等函数分类上,例: create index

  • Oracle轻松取得建表和索引的DDL语句

    我们都知道在9i之前,要想获得建表和索引的语句是一件很麻烦的事.我们可以通过export with rows=no来得到,但它的输出因为格式的问题并不能直接拿来用.而另一种方法就是写复杂的脚本来查询数据字典,但这对于一稍微复杂的对象,如IOT和嵌套表等,还是无法查到. 从数据字典中获得DDL语句是经常要用的,特别是在系统升级/重建的时候.在Oracle 9i中,我们可以直接通过执行dbms_metadata从数据字典中查处DDL语句.使用这个功能强大的工具,我们可以获得单个对象或整个SCHEMA

  • Oracle数据库索引的维护

    正在看的ORACLE教程是:Oracle数据库索引的维护. 本文只讨论Oracle中最常见的索引,即是B-tree索引.本文中涉及的数据库版本是Oracle8i. 一. 查看系统表中的用户索引 在Oracle中,SYSTEM表是安装数据库时自动建立的,它包含数据库的全部数据字典,存储过程.包.函数和触发器的定义以及系统回滚段. 一般来说,应该尽量避免在SYSTEM表中存储非SYSTEM用户的对象.因为这样会带来数据库维护和管理的很多问题.一旦SYSTEM表损坏了,只能重新生成数据库.我们可以用下

  • Oracle 数据库中创建合理的数据库索引

    笔者认为,在创建索引时要做到三个适当,即在适当的表上.适当的列上创建适当数量的索引.虽然这可以通过一句话来概括优化的索引的基本准则,但是要做到这一点的话,需要数据库管理员做出很大的努力.具体的来说,要做到这个三个适当有如下几个要求. 一. 根据表的大小来创建索引. 虽然给表创建索引,可以提高查询的效率.但是数据库管理员需要注意的是,索引也需要一定的开销的.为此并不是说给所有的表都创建索引,那么就可以提高数据库的性能.这个认识是错误的.恰恰相反,如果不管三七二十一,给所有的表都创建了索引,那么其反

  • Oracle与Mysql主键、索引及分页的区别小结

    区别: 1.主键,Oracle不可以实现自增,mysql可以实现自增. oracle新建序列,SEQ_USER_Id.nextval 2.索引: mysql索引从0开始,Oracle从1开始. 3.分页, mysql: select * from user order by desc limit n ,m. 表示,从第n条数据开始查找,一共查找m条数据. Oracle:select * from user select rownum a * from ((select * from user)a

随机推荐