uv sync文本提取需额外安装 OCR(按需):
uv pip install rapidocr-onnxruntime onnxruntime
# GPU:uv pip install onnxruntime-gpuuv run python tools/wechat_window_loop_ocr.py --interval-ms 1000网页标注 — 启动后打开 http://127.0.0.1:8810/
uv run python tools/fount/server.py半自动标注
uv run python tools/label_review.py --weights runs/detect/wechat_bubbles-7/weights/best.ptuv run python tools/split_dataset.py --train-ratio 0.8uv run python train_bubbles.py --model runs/detect/wechat_bubbles-7/weights/best.pt不指定 --model 则从头训练新模型。
uv run python predict_bubbles.py --weights runs/detect/wechat_bubbles-7/weights/best.pt --source testuv run python text_process.py| 目录 | 说明 |
|---|---|
before_img/ |
截图原图 |
img/、labels/ |
标注图片与 YOLO 标签 |
dataset/ |
训练 / 验证集 |
runs/detect/.../weights/ |
模型权重 |
predict_out/ |
推理结果 |
text_json/、text_img/ |
OCR 文本输出 |
| 类别 | 技术 |
|---|---|
| 语言 / 环境 | Python 3.11+、uv |
| 深度学习 | PyTorch、TorchVision、Ultralytics YOLOv8 |
| 图像 | OpenCV、Pillow、NumPy |
| OCR | RapidOCR + ONNX Runtime |
| 标注前端 | HTML / CSS / Canvas + http.server |
| 截图 | Win32 API(ctypes)+ PIL |