网站首页 > 技术文章 正文
Oracle 23ai 引入了原生向量数据类型 Vector,Oracle 多模融合数据库从此正式拥有的向量数据库这种新的模态。
--email table
CREATE TABLE emails(
email_id NUMBER PRIMARY KEY,
email VARCHAR2(150) NOT NULL,
embedding VECTOR(*,FLOAT32)
);
定义表时指定 VECTOR 数据类型,参数是 VECTOR(维度,数字类型),维度和数字类型均可不指定;不指定时维度会根据插入的数据自动计算出来,数字类型则通常默认为 FLOAT32。数字类型最好预先指定,与Embedding模型的输入数字类型一致,避免可能的类型推导错误。
向表中插入数据跟平时的SQL insert 语句并没什么区别,比如:
insert into emails values (1, 'M31', 'abc@company.com', '[0,1,1,0,0]');
commit;
向量相似度检索的核心方法是 VECTOR_DISTANCE,比如:
SELECT email
FROM emails
ORDER BY VECTOR_DISTANCE( embedding, to_vector('[0,3,3,0,0]'), COSINE )
FETCH FIRST 3 ROWS ONLY;
向量数据可以从别的数据库导出,然后再导入Oracle数据库。导出的向量数据可以是文本CSV格式,也可以是更高效的二进制向量格式;其它格式也可以转换为二进制向量格式。
SQL*Loader 是非常高效的数据导入工具,支持直接数据块路径加载方式(Direct path)。这里以导入文本CSV为例,将向量数据导入到Oracle数据库中:
sqlldr parfile=email.par
--email table
CREATE TABLE emails(
email_id NUMBER PRIMARY KEY,
email VARCHAR2(150) NOT NULL,
embedding VECTOR(*,FLOAT32)
);
-- email.dat
1:john.doe@example.com:[0.816517174243927, 0.9929907321929932,...]
2:jane.doe@example.com:[0.816517174243927, 0.9929907321929932,...]
3:peter.doe@example.com:[0.816517174243927, 0.9929907321929932, ...]
-- email.ctl
load data into table emails
insert
fields terminated by ":"
trailing nullcols
(
email_id,
email,
embedding char(32767) NULLIF EMBEDDING=BLANKS
)
--email.par
userid=user0/user0@<数据库地址>:1521/ai23pdb.cn.osc.oracle.com
control=email.ctl
log=email.log
bad=email.bad
data=email.dat
direct=true
更多详细资料以及用二进制方式导入,可以参考文档:https://docs.oracle.com/en/database/oracle/oracle-database/23/vecse/load-binary-vector-data-using-sqlloader-example.html
猜你喜欢
- 2024-10-25 Oracle低代码平台APEX如何实现工作区所有应用一次导出和导入
你 发表评论:
欢迎- 627℃几个Oracle空值处理函数 oracle处理null值的函数
- 621℃Oracle分析函数之Lag和Lead()使用
- 610℃0497-如何将Kerberos的CDH6.1从Oracle JDK 1.8迁移至OpenJDK 1.8
- 604℃Oracle数据库的单、多行函数 oracle执行多个sql语句
- 601℃Oracle 12c PDB迁移(一) oracle迁移到oceanbase
- 593℃【数据统计分析】详解Oracle分组函数之CUBE
- 584℃最佳实践 | 提效 47 倍,制造业生产 Oracle 迁移替换
- 567℃Oracle有哪些常见的函数? oracle中常用的函数
- 最近发表
-
- oracle 19cOCM认证有哪些内容(oracle认证ocm月薪)
- Oracle新出AI课程认证,转型要持续学习
- oracle 表的查询join顺序,可能会影响查询效率
- Oracle DatabaseAmazon Web Services正式可用,Oracle数据库上云更容易了
- Oracle 19.28 RU 升级最佳实践指南
- 汉得信息:发布EBS系统安装启用JWS的高效解决方案
- 如何主导设计一个亿级高并发系统架构-数据存储架构(三)
- Java 后端开发必看!工厂设计模式轻松拿捏
- ORA-00600 「25027」 「x」报错(抱错孩子电视剧 爸爸是武术 另一个爸爸是画家)
- 新项目终于用上了jdk24(jdk新建项目)
- 标签列表
-
- 前端设计模式 (75)
- 前端性能优化 (51)
- 前端模板 (66)
- 前端跨域 (52)
- 前端缓存 (63)
- 前端aes加密 (58)
- 前端脚手架 (56)
- 前端md5加密 (54)
- 前端路由 (61)
- 前端数组 (73)
- 前端js面试题 (50)
- 前端定时器 (59)
- 前端获取当前时间 (50)
- Oracle RAC (76)
- oracle恢复 (77)
- oracle 删除表 (52)
- oracle 用户名 (80)
- oracle 工具 (55)
- oracle 内存 (55)
- oracle 导出表 (62)
- oracle约束 (54)
- oracle 中文 (51)
- oracle链接 (54)
- oracle的函数 (58)
- 前端调试 (52)
本文暂时没有评论,来添加一个吧(●'◡'●)