Atitit 信息检索 文档资料的查询与检索 目录 1. 索引法 1 1.1. 名字placeholder索引 1 1.2. 文本txt索引 1 1.3. 索引集合包zip 1 1.4. 文件名

Atitit  信息检索 文档资料的查询与检索

 

 

目录

1. 索引法 1

1.1. 名字placeholder索引 1

1.2. 文本txt索引 1

1.3. 索引集合包zip 1

1.4. 文件名单列表索引 1

2. 检索法 2

2.1. By 文件name ,,by content 2

2.2. 根据tag名称 2

2.3. 根据内容 2

2.4. 根据内容挖掘 属性补齐 查询 2

3. 数据检索的方式 2

3.1. 顺序扫描法(简单 2

3.2. 全文索引法 2

4. 检索法  批量检索 2

4.1. Zip rar文件 2

4.2. Dir 目录 2

5. Office信息检索 3

6. Pdf检索 3

7. Zip rar文件检索法 3

 

  1.  索引法
    1. 名字placeholder索引
    2. 文本txt索引
    3. 索引集合包zip 
    4. 文件名单列表索引

 

  1. 检索法
    1. By 文件name ,,by content
    2. 根据tag名称
    3. 根据内容
    4. 根据内容挖掘 属性补齐 查询

比如音乐,按照年代查询

 

 

  1. 数据检索的方式

 

    1. 顺序扫描法(简单
    2. 全文索引法
  1. 检索法  批量检索
    1. Zip rar文件
    2. Dir 目录

 

  1. Office信息检索

doctotext.exe

文档读写

Office pdf eml文件读取解析转换

Atitit 文档资料处理重要类库与工具

 

跨语言api和第三方api跨语言

 

 

 

  1. Pdf检索

 

  1. Zip rar文件检索法

Atitit 文档资料处理重要类库与工具

 

跨语言api和第三方api跨语言

 

类库工具

大概功能

功能

Curl

httpclient

文件上传下载  数据传输rest

doctotext.exe

文档读写

Office pdf eml文件读取解析转换

Apache  net imap

文档读写

Imap

apache.commons.net.imap.IMAP

 

 

 

Es solr

全文检索

 

 

 

 

Ik mmseg lucence

全文检索

 

Mysql。Exe

 

数据库sql解析读取

Ffmpeg

多媒体

音视频工具,kalaok效果伴奏分离

Kmplayer

Potplayer

多媒体

视频播放

mplayer.exe

多媒体

音频播放

jfugue 

 

多媒体

midi lib

Opencv

图像

人脸识别

Tesseract

图像

ocr

snowNlp

nlp

 

百度语音api

多媒体

Asr语言识别 Tts语音处理

Librosa

多媒体

节拍获取

2.26. 绘制声音波形 5

2.27. 绘制频谱图 5

Poi

office

 

pdfbox

Pdf

可以以java cli模式执行。。

Php node.js python.exe

语句执行

Velocity freemark ognl

ziptool

压缩文件处理

 

jsoup

Html处理

 

zxing 

物联网图像

二维码条码

Echart  Highcharts

 

报表

Sikuli  

机器人

 

Springcloud

Springboot

 

 

Dbutil  Hiernate  vue bootstrap jqury

mybatis

Wmic

 

进程隔离  硬件信息获取

摄像头列表 设备管理wmic 打印机列表  打印功能

Java-WebSocket-1.3.0.jar

 

 

JSch

 

实现SFTP功能 ssh

阿里云短信

 

 

Httpclient.jar

 

 

爬虫库

 

 

mongodb es solr

大数据库

 

webdriver

 

 

 

 

 

 

 

 

Atitit maven 常见类库配置法 maven common lib jar v2 t88

 

目录

1. Express DSL COMMON 2

1.1. Ognl 2

1.2. velocity 2

1.3. <!--groovy --> 2

1.4. guava 3

1.5. commons-lang3 3

1.6. commons-cli-1.4 3

1.7. Beanshell bsh  bsh-core-2.0b4 3

2. Common 4

2.1. commons-io-2.4 4

2.2. commons-codec-1.7 4

2.3. commons-collections-3.1 4

3. Data 4

3.1. Jsoup html 4

3.2. <!-- fastjson --> 4

3.3. <!-- ati poi pdfbox --> 5

4. Db 6

4.1. dbutils 6

4.2. Mysql mybatis 6

4.3. mongodb 7

5. NET Rest 7

5.1. javax.ws.rs-api-2.1 7

5.2. Ssh client jsch 7

5.3. <!--httpclient --> 7

6. dbg 8

6.1. log4j-1.2.9 8

6.2. JDBC故障诊断库 P6Spy  8

6.3. Junit 8

6.4. Slf4j 9

6.5. swagger2  doc 9

7. Other 9

7.1. 9

7.2. <!-- tomcat --> 9

8. ref 11

 

Atitit maven 常见类库配置法 maven common lib jar v2 t88

Atitit word office文档转换txt 纯文本 docx转txt 解决方案 v2 s22.docx

posted @ 2019-09-06 00:56  attilaxAti  阅读(81)  评论(0编辑  收藏  举报