编译YOLO+TensorRT+Cuda为SO库，并通过Python调用

项目简介

项目目标

把 TensorRT C++ api推理 YOLOv5的代码，打包成动态链接库，并通过 Python 调用。

这样做的原因：

使用 TensorRT 的 C++ api优化 YOLO 模型，可以显著提升目标检测的速度，但 C++ 代码不方便扩展为网络通信协议接口；
Python 作为最流行的胶水语言，拥有很多成熟的通信协议库，可以方便的进行各种网络协议通信，赋能于各种各样的服务；

因此，若将C++的模型推理代码编译为动态链接库，再使用Python封装，那就既有推理速度的优势，又具备可扩展性的便利

可能有人问为什么不直接使用 TensorRT Python Api，看似可以达到相同的效果，作者认为本项目有以下优势，比直接使用TensorRT Python Api 更好：

使用 TensorRT Python Api 时，前处理和后处理需使用 Python 完成，不过也是通过numpy实现的，速度方面没有太大差距；
作者使用 Cuda 编程加速预处理，提升预处理速度，之后一同打包到动态链接库，推理速度更快。

项目概述

使用 TensorRT-v8.2 的 C++ api，加速YOLOv5-v5.0 目标检测；
在 Linux x86_64 上进行部署；
在 Jetson系列嵌入式设备上也是可行的，把本项目中的 CMakeLists.txt 文件中头文件、库文件相关目录更换即可；

大致实现过程如下：

作者把 YOLOv5 的 TensorRT 推理封装成 C++ 的类，关键代码如下：

class YoloDetecter
{
public:
    YoloDetecter(const std::string trtFile, const int gpuId);
    ~YoloDetecter();
    float* inference(cv::Mat& img);
};

接着作者使用 C 类型的函数再次封装上面的类，关键代码如下：

#ifdef __cplusplus
extern "C" {
#endif

YoloDetecter* YoloDetecter_new(char* trtFile, int gpuId){
    return new YoloDetecter(std::string(trtFile), gpuId);
}

float* inference_one(YoloDetecter* instance, const uchar* srcImgData, const int srcH, const int srcW){
    cv::Mat srcImg(srcH, srcW, CV_8UC3);
    memcpy(srcImg.data, srcImgData, srcH * srcW * 3 * sizeof(uchar));
    return instance->inference(srcImg);
}

void destroy(YoloDetecter* instance) { delete instance; }

#ifdef __cplusplus
}
#endif

把封装后的代码生成动态链接库，CMakeLists.txt 中的关键部分如下

# ====== yolo infer shared lib ======
cuda_add_library(yolo_infer SHARED 
    ${PROJECT_SOURCE_DIR}/src/preprocess.cu 
    ${PROJECT_SOURCE_DIR}/src/yololayer.cu 
    ${PROJECT_SOURCE_DIR}/src/yolo_infer.cpp
    ${PROJECT_SOURCE_DIR}/main.cpp
)
target_link_libraries(yolo_infer nvinfer cudart ${OpenCV_LIBS})

再接着作者使用 Python 封装一个检测类，类当中调用的是上述 C/C++ 代码，关键部分代码如下：

class YoloDetector:
    def __init__(self, trt_file, gpu_id=0):
        self.yolo_infer_lib = ctypes.cdll.LoadLibrary("./lib/libyolo_infer.so")
        self.cpp_yolo_detector = self.yolo_infer_lib.YoloDetecter_new(trt_file.encode('utf-8'), gpu_id)

    def release(self):
        self.yolo_infer_lib.destroy(self.cpp_yolo_detector)

    def infer(self, image):
        out_data = self.yolo_infer_lib.inference_one(self.cpp_yolo_detector, image, height, width)
        out_data = as_array(out_data).copy().reshape(-1)

最后，使用者不必关心具体的实现，仅仅使用下面的 2 行代码，即可实现 Python 对 YOLOv5+TensorRT C++ 代码的调用

# 实例化目标检测类
yolo_infer = YoloDetector(trt_file=plan_path, gpu_id=0)
# 使用目标检测实例推理
detect_res = yolo_infer.infer(img)

项目效果

环境要求

作者自己所使用的基本环境如下：

Ubuntu	CUDA	cuDNN	TensorRT	OpenCV
20.04	11.6	8.4	8.2.4	4.5.0

想要方便点的话，可以直接拉取一个 docker 镜像：

docker pull nvcr.io/nvidia/tensorrt:22.04-py3

然后在镜像中编译安装 OpenCV，具体可参考下面链接中的环境构建部分：

https://github.com/emptysoal/TensorRT-v8-YOLOv5-v5.0

python 第三方库环境

pip install numpy==1.22.3
pip install opencv-python==3.4.16.59

模型转换

把 YOLO检测模型，转换成TensorRT的序列化文件，后缀 .plan（作者的习惯，也可以是.engine或其他）

原模型下载

链接：https://pan.baidu.com/s/1YG-A8dXL4zWvecsD6mW2ug
提取码：y2oz

下载并解压后，模型文件说明：

模型文件目录
    └── YOLOv5-v5.0  # 该目录中存放的是 YOLOv5 目标检测网络的模型
        ├── yolov5s.pt  # 官方 PyTorch 格式的模型文件
        └── para.wts  # 根据 yolov5s.pt 导出的 wts 格式模型文件

也可以直接从官方YOLOv5-v5.0处下载 yolov5s.pt，然后直接进入到下面的模型转换

YOLO模型转换

将上述 yolov5s.pt 转为 model.plan，或 para.wts转为 model.plan
具体转换方法参考下面链接，也是作者自己发布的一个项目
https://github.com/emptysoal/TensorRT-v8-YOLOv5-v5.0/tree/main

完成之后便可得到 model.plan ，为检测网络的 TensorRT 序列化模型文件。

运行项目

开始编译并运行
按如下步骤

# 创建用于存储 TensoRT 模型的目录
mkdir resources
# 把上面转换得到的 plan 文件复制到目录 resources 中
cp {TensorRT-v8-YOLOv5-v5.0}/model.plan ./resources

mkdir images  # 向其中放入用于推理的图片文件

mkdir build
cd build
cmake ..
make
# 以上执行完成后，会生成 lib 目录，其中存放着 C++ 代码所生成的动态链接库

# 运行 python 推理代码，即可调用动态链接库完成快速推理
python main.py
# 检测结果会保存到output目录下

运行后可以看到如下日志：

Succeeded getting serialized engine!
Succeeded loading engine!
Model load cost: 1.2174 s
Infer 001.jpg cost: 0.0077 s
Infer 002.jpg cost: 0.0054 s
Infer 003.jpg cost: 0.0043 s

项目参考

在Python如何调用C++代码部分，主要参考了下面的链接：

其他项目

作者的一些其他项目，若感兴趣，欢迎交流

基于TensorRT v8部署加速YOLOv5-v5.0

Deepsort+YOLOv5的TensorRT加速部署

CUDA编程加速图像预处理

TensorRT各种API对模型加速效果的对比实验

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
images		images
include		include
samples		samples
src		src
.gitignore		.gitignore
CMakeLists.txt		CMakeLists.txt
LICENSE		LICENSE
README-en.md		README-en.md
README.md		README.md
labels.py		labels.py
main.cpp		main.cpp
main.py		main.py
yolo_detector.py		yolo_detector.py
yolo_detector_v1.py		yolo_detector_v1.py

License

emptysoal/YOLOv5-TensorRT-lib-Python

Folders and files

Latest commit

History

Repository files navigation

编译YOLO+TensorRT+Cuda为SO库，并通过Python调用

项目简介

项目目标

项目概述

项目效果

环境要求

模型转换

原模型下载

YOLO模型转换

运行项目

项目参考

其他项目

About

Topics

Resources

License

Stars

Watchers

Forks

Languages