GOT-OCR2.0 部署
GOT-OCR2.0 部署
克隆仓库
1 | git clone git@github.com:Ucas-HaoranWei/GOT-OCR2.0.git |
安装cuda
1 | nvcc --version |
使用Anaconda Prompt
1 | cd GOT-OCR2.0/GOT-OCR-2.0-master/ |
1 | conda create -n got python=3.10 -y |
安装 PyTorch 和 TorchVision
1 | pip install torch==2.0.1 torchvision==0.15.2 torchaudio==2.0.2 --index-url https://download.pytorch.org/whl/cu118 |
1 | pip install -e . |
安装DeepSpeed报错(Unable to pre-compile async_io)
首先通过git下载deepspeed:
1 | git clone https://github.com/microsoft/DeepSpeed.git |
运行如下命令:
1 | Set-Item Env:\DS_BUILD_OPS 0 |
进入deepspeed文件夹下,运行build_win.bat编译DeepSpeed
进入dist文件夹,运行pip install命令进行安装
1 | pip install .\deepspeed-0.14.1+unknown-py3-none-any.whl |
也可以直接使用官方的Github项目地址发布的whl包
1 | pip install deepspeed-0.14.3+cf8316a4-cp310-cp310-win_amd64.whl |
修改pyproject.toml 文件中的安装deepspeed版本设置(默认版本的没有在官方下找到对应whl包),再返回进行pip install -e . 才能安装成功
测试
1 | python GOT/demo/run_ocr_2.0.py --model-name "D:\Application\Develop\Project\python\GOT-OCR2.0\GOT-OCR-2.0-master\GOT\GOT_weights" --image-file "D:\User\yaoye\Pictures\QQ20241226-004924.png" --type ocr |