博主头像 Southerly 博主 4月24日 在线

轻量级AI证件照工具HivisionIDPhotos部署过程

  • Southerly 2024年11月02日 259阅读 0评论
  • AI摘要:HivisionIDPhotos是一款轻量级AI证件照工具,支持多种拍照场景识别、抠图和证件照生成。它支持离线或端云推理,具备美颜和智能换正装功能。部署过程包括环境安装、依赖安装、模型下载和配置等步骤。

    🍂🍁Southerly🍁🍂

    HivisionIDPhoto 旨在开发一种实用、系统性的证件照智能制作算法。

    它利用一套完善的AI模型工作流程,实现对多种用户拍照场景的识别、抠图与证件照生成。
    demo.png
    HivisionIDPhoto 可以做到:

    1. 轻量级抠图(纯离线,仅需 CPU 即可快速推理)
    2. 根据不同尺寸规格生成不同的标准证件照、六寸排版照
    3. 支持 纯离线 或 端云 推理
    4. 美颜
    5. 智能换正装(waiting)

    🔧 准备工作


    环境安装与依赖:

    • Python >= 3.7(项目主要测试在 python 3.10)
    • OS: Linux, Windows, MacOS
    1. 克隆项目

    git clone https://github.com/Zeyi-Lin/HivisionIDPhotos.git
    cd  HivisionIDPhotos
    2. 安装依赖环境

    建议 conda 创建一个 python3.10 虚拟环境后,执行以下命令
    pip install -r requirements.txt
    pip install -r requirements-app.txt
    3. 下载人像抠图模型权重文件

    方式一:脚本下载

    python scripts/download_model.py --models all
    # 如需指定下载某个模型
    # python scripts/download_model.py --models modnet_photographic_portrait_matting

    方式二:直接下载

    模型均存到项目的hivision/creator/weights目录下:

    人像抠图模型介绍下载
    MODNetMODNet官方权重下载(24.7MB)
    hivision\_modnet对纯色换底适配性更好的抠图模型下载(24.7MB)
    rmbg-1.4BRIA AI 开源的抠图模型下载(176.2MB)后重命名为rmbg-1.4.onnx
    birefnet-v1-liteZhengPeng7 开源的抠图模型,拥有最好的分割精度下载(224MB)后重命名为birefnet-v1-lite.onnx
    如果下载网速不顺利:前往SwanHub下载。
    4. 人脸检测模型配置(可选)

    拓展人脸检测模型介绍使用文档
    MTCNN离线人脸检测模型,高性能CPU推理(毫秒级),为默认模型,检测精度较低Clone此项目后直接使用
    RetinaFace离线人脸检测模型,CPU推理速度中等(秒级),精度较高下载后放到hivision/creator/retinaface/weights目录下
    Face++旷视推出的在线人脸检测API,检测精度较高,官方文档使用文档
    5. 性能参考

    测试环境为Mac M1 Max 64GB,非GPU加速,测试图片分辨率为 512x715(1) 与 764×1146(2)。
    模型组合内存占用推理时长(1)推理时长(2)
    MODNet + mtcnn410MB0.207s0.246s
    MODNet + retinaface405MB0.571s0.971s
    birefnet-v1-lite + retinaface6.20GB7.063s7.128s
    6. GPU推理加速(可选)

    在当前版本,可被英伟达GPU加速的模型为birefnet-v1-lite,并请确保你有16GB左右的显存。

    如需使用英伟达GPU加速推理,在确保你已经安装CUDAcuDNN后,根据onnxruntime-gpu文档找到对应的onnxruntime-gpu版本安装,以及根据pytorch官网找到对应的torch版本安装。

    # 假如你的电脑安装的是CUDA 12.x, cuDNN 8
    # 安装torch是可选的,如果你始终配置不好cuDNN,那么试试安装torch
    pip install onnxruntime-gpu==1.18.0
    pip install torch --index-url https://download.pytorch.org/whl/cu121

    完成安装后,调用birefnet-v1-lite模型即可利用GPU加速推理。

    TIPS: CUDA 支持向下兼容。比如你的 CUDA 版本为 12.6,torch 官方目前支持的最高版本为 12.4(<12.6),torch仍可以正常使用CUDA。

    ⚡️ 运行 Gradio Demo

    python app.py

    运行程序将生成一个本地 Web 页面,在页面中可完成证件照的操作与交互。

    项目地址:

    本文共 638 个字数,平均阅读时长 ≈ 2分钟
    1
    打赏

    —— 评论区 ——

    昵称
    邮箱
    网址
    取消
    站点公告

    请勿在本站点发表不当言论,以及进行恶意引流行为,否则会对该ip进行封禁处理

      2024年还剩下:
      0 64 11小时 35 35


    人生倒计时
    舔狗日记