搜索文件内容的几种方式

搜索文件内容的几种方式缺点 索引的长度有限制

大家好,欢迎来到IT知识分享网。

搜索文件的几种方式:

一、提取文件, 插入数据库text,使用like 查询。

使用poi或PageOffice提取文件内容文字

缺点:只适合数据量不大的情况

二、提取文件, 插入数据库text,创建文件索引。

select * from 表名 where match(content) against(‘a’);

缺点:索引的长度有限制。必须添加4条以上。中文支持不好(前后模糊查询查不到,要用空格分隔才行)。经常出现的不会索引,查不到。

三、使用搜索引擎Elasticsearch

安装插件: ik 分词器 使用ik_smart或ik_max_word

安装插件:ingest-attachment(8+版本不用安装)

定义pipline

转化成 Base64 编码

上传文件

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/136086.html

(0)
上一篇 2025-06-29 22:10
下一篇 2025-06-29 22:15

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信