故障排除指南
本文档列出了使用 Webis 时的常见错误和解决方案。
安装依赖时出现错误
原因:
- 使用了不兼容的 Python 版本,或包管理器配置问题。
解决方案:
- 确保您使用的是兼容的 Python 版本(3.8+)。
- 您可能需要使用
pip3而不是pip。
EasyOCR 首次启动运行非常慢
原因:
- EasyOCR 在首次使用时需要下载模型文件。
解决方案:
- 请耐心等待模型文件下载完成。下载完成后,后续使用会更快。
图像识别准确率低
原因:
- 图像分辨率过低、文本不清晰,或置信度阈值设置不当。
解决方案:
- 提高图像分辨率
- 确保文本清晰
- 调整置信度阈值(在代码中设置
confidence > 0.5)
无法从 PDF 提取文本
原因:
- PDF 可能是扫描版本,不包含可提取的文本层。
解决方案:
- 建议先将其转换为图像,然后使用 OCR 处理。
无法访问 API:401 未授权
原因:
- 未提供有效的 API 密钥,或服务器已启用身份验证。
解决方案:
- 检查项目根目录中的
api_keys.json文件并复制有效密钥。 - 调用 API 时添加
api_key参数。示例:
bash
curl -X POST http://localhost:8000/generate -H "Content-Type: application/json" -d '{"prompt": "hello", "api_key": "your-key"}'模型加载失败:GPU 内存不足
错误信息:
text
ValueError: Free memory on device (...) is less than desired GPU memory utilization (...)原因:
- 剩余的 GPU 内存少于模型所需的内存限制。
解决方案:
- 降低
GPU_MEMORY_UTILIZATION设置:
bash
export GPU_MEMORY_UTILIZATION=0.6错误:找不到 libcudart.so
错误信息:
text
ImportError: libcudart.so.11.0: cannot open shared object file: No such file or directory原因:
- 未安装 CUDA 动态库,或库版本不兼容。
解决方案:
- 通过 conda 安装对应 CUDA 版本的 PyTorch:
bash
conda install pytorch-cuda=12.1 -c pytorch -c nvidia构建失败:找不到 C 编译器
错误信息:
text
RuntimeError: Failed to find C compiler.原因:
- 缺少编译工具(如
gcc),导致 Triton 编译模型内核时失败。
解决方案:
bash
sudo apt update
sudo apt install build-essential无模型输出 / API 返回空字符串
原因:
prompt内容不完整或缺乏上下文。max_tokens(要生成的最大 token 数)设置过低,导致生成的内容被截断。
解决方案:
- 适当增加
max_tokens参数(例如,256 → 512)。 - 使用清晰的提示。示例:
text
请从以下 HTML 中提取联系人姓名和电话号码:<html>...</html>包管理器锁定错误(dpkg/apt)
错误信息:
text
Waiting for cache lock: Could not get lock /var/lib/dpkg/lock-frontend. It is held by process原因:
- 另一个包管理进程(apt、apt-get、dpkg 或系统更新)正在运行。
- 之前的安装过程被中断,留下残留的锁定文件。
解决方案:
- 如果合法的更新进程正在运行,请等待其完成。
- 如果没有其他更新进程在运行,检查哪个进程持有锁定:
bash
ps aux | grep -i apt- 如有必要,删除锁定文件(谨慎使用):
bash
sudo rm /var/lib/apt/lists/lock
sudo rm /var/lib/dpkg/lock
sudo rm /var/lib/dpkg/lock-frontend
sudo dpkg --configure -a