主要模块描述 1、tools 大纲解析模块 2、get_info PDF信息抽取模块 3、matcher 段落定位模块 ##### PDF中无边框表格内容抽取 ``` 1. camelot-py git源下载 git clone https://www.github.com/camelot-dev/camelot 修改pyproject.toml中 pdfminer-six = "^20231228" 安装命令: 进入camelot目录下,pip install -e . 2. 在wsl Debian中安装 ghostscript 【模块本身】 apt install ghostscript 3. ghostscript 下载 pip install ghostscript==0.7.0 【模块驱动】 4. 代码修改 【CV运行时不需要设置宽高,使用默认即可】 tables_pro = camelot.read_pdf( self.file_path, # flavor='stream', pages=str(page_number+1), # edge_tol=200, # row_tol=50, ) ```