首页
  • GM-3568JHF
  • M4-R1
  • M5-R1
  • SC-3568HA
  • M-K1HSE
  • CF-NRS1
  • CF-CRA2
  • 1684XB-32T
  • 1684X-416T
  • RDK-X5
  • RDK-S100
  • C-3568BQ
  • C-3588LQ
  • GC-3568JBAF
  • C-K1BA
商城
  • English
  • 简体中文
首页
  • GM-3568JHF
  • M4-R1
  • M5-R1
  • SC-3568HA
  • M-K1HSE
  • CF-NRS1
  • CF-CRA2
  • 1684XB-32T
  • 1684X-416T
  • RDK-X5
  • RDK-S100
  • C-3568BQ
  • C-3588LQ
  • GC-3568JBAF
  • C-K1BA
商城
  • English
  • 简体中文
  • 1684XB-32T

    • 一、简介

      • AIBOX-1684XB-32简介
    • 二、快速上手

      • 初次使用
      • 网络配置
      • 磁盘使用
      • 内存分配
      • 风扇策略
      • 固件升级
      • 交叉编译
      • 模型量化
    • 三、应用开发

      • 开发简介

        • Sophgo SDK开发
        • SOPHON-DEMO简介
      • 大语言模型

        • 部署Llama3示例
        • Sophon LLM_api_server开发
        • 部署MiniCPM-V-2_6
        • Qwen-2-5-VL图片视频识别DEMO
        • Qwen3-chat-DEMO
        • Qwen3-Qwen Agent-MCP开发
        • Qwen3-langchain-AI Agent
      • 深度学习

        • ResNet(图像分类)
        • LPRNet(车牌识别)
        • SAM(通用图像分割基础模型)
        • YOLOv5(目标检测)
        • OpenPose(人体关键点检测)
        • PP-OCR(光学字符识别)
    • 四、资料下载

      • 资料下载
  • 1684X-416T

    • 简介

      • AIBOX-1684X-416简介
    • Demo简单操作指引

      • shimeta智慧监控demo的简单使用说明
  • RDK-X5

    • 简介

      • RDK-X5 硬件简介
    • 快速开始

      • RDK-X5 快速开始
    • 应用开发

      • AI在线模型开发

        • 实验01-接入火山引擎豆包 AI
        • 实验02-图片分析
        • 实验03-多模态视觉分析定位
        • 实验04-多模态图文比较分析
        • 实验05-多模态文档表格分析
        • 实验06-摄像头运用-AI视觉分析
      • 大语言模型

        • 实验01-语音识别
        • 实验02-语音对话
        • 实验03-多模态图片分析-语音对话
        • 实验04-多模态图片比较-语音对话
        • 实验05-多模态文档分析-语音对话
        • 实验06-多模态视觉运用-语音对话
      • ROS2基础开发

        • 实验01-搭建环境
        • 实验02-工作包的创建及编译
        • 实验03-运行 ROS2 话题通信节点
        • 实验04-ROS2 相机应用
      • 40pin-IO开发

        • 实验01-GPIO 输出(LED闪烁)
        • 实验02-GPIO 输入
        • 实验03-按键控制 LED
        • 实验04-PWM 输出
        • 实验05-串口输出
        • 实验06-IIC 实验
        • 实验07-SPI 实验
      • USB模块开发使用

        • 实验01-USB 语音模块使用
        • 实验02-声源定位模块使用
      • 机器视觉技术实战

        • 实验01-打开 USB 摄像头
        • 实验02-颜色识别检测
        • 实验03-手势识别体验
        • 实验04-YOLOv5物体检测
  • RDK-S100

    • 简介

      • RDK-S100 硬件简介
    • 快速开始

      • RDK-S100 硬件简介
    • 应用开发

      • AI在线模型开发

        • 实验01-接入火山引擎豆包 AI
        • 实验02-图片分析
        • 实验03-多模态视觉分析定位
        • 实验04-多模态图文比较分析
        • 实验05-多模态文档表格分析
        • 实验06-摄像头运用-AI视觉分析
      • 大语言模型

        • 实验01-语音识别
        • 实验02-语音对话
        • 实验03-多模态图片分析-语音对话
        • 实验04-多模态图片比较-语音对话
        • 实验05-多模态文档分析-语音对话
        • 实验06-多模态视觉运用-语音对话
      • ROS2基础开发

        • 实验01-搭建环境
        • 实验02-工作包的创建及编译
        • 实验03-运行 ROS2 话题通信节点
        • 实验04-ROS2 相机应用
      • 40pin-IO开发

        • 实验01-GPIO 输出(LED闪烁)
        • 实验02-GPIO 输入
        • 实验03-按键控制 LED
        • 实验04-PWM 输出
        • 实验05-串口输出
        • 实验06-IIC 实验
        • 实验07-SPI 实验
      • USB模块开发使用

        • 实验01-USB 语音模块使用
        • 实验02-声源定位模块使用
      • 机器视觉技术实战

        • 实验01-打开 USB 摄像头
        • 实验02-图像处理基础
        • 实验03-目标检测
        • 实验04-图像分割

实验2-颜色识别检测

  1. pip install opencv-python #下载open-cv数据库(另外需自行安装python3,如已下载可忽略)
  2. cd OPENCV #打开OPENCV功能包
  3. sudo python3 ./color_detection.py #运行py文件

终端显示:

TOOL

此时Linux系统上会显示摄像头实时画面,我们需要在窗口焦点下测试按键,效果如下:

TOOL
#!/usr/bin/env python
# -*- coding: utf-8 -*-

"""
多颜色同时识别程序
功能:实时识别摄像头中的多种颜色物体
"""

import cv2
import numpy as np
import sys
import os
import argparse

def main():
    """
    主函数:打开摄像头并进行多颜色同时识别
    """
    # 解析命令行参数
    parser = argparse.ArgumentParser(description='多颜色同时识别程序')
    parser.add_argument('--width', type=int, default=2560, help='显示窗口宽度')
    parser.add_argument('--height', type=int, default=1440, help='显示窗口高度')
    args = parser.parse_args()

    # 打开默认摄像头
    cap = cv2.VideoCapture(0)

    # 检查摄像头是否成功打开
    if not cap.isOpened():
        print("错误:无法打开摄像头")
        sys.exit(1)

    # 设置摄像头分辨率
    cap.set(cv2.CAP_PROP_FRAME_WIDTH, args.width)
    cap.set(cv2.CAP_PROP_FRAME_HEIGHT, args.height)

    # 创建窗口并设置大小
    cv2.namedWindow('Original', cv2.WINDOW_NORMAL)
    cv2.namedWindow('Color Detection', cv2.WINDOW_NORMAL)
    cv2.namedWindow('Controls', cv2.WINDOW_NORMAL)

    # 设置窗口大小
    cv2.resizeWindow('Original', args.width // 2, args.height // 2)
    cv2.resizeWindow('Color Detection', args.width // 2, args.height // 2)
    cv2.resizeWindow('Controls', 600, 300)

    # 创建HSV颜色范围的滑动条
    cv2.createTrackbar('H_min', 'Controls', 0, 179, lambda x: None)
    cv2.createTrackbar('H_max', 'Controls', 179, 179, lambda x: None)
    cv2.createTrackbar('S_min', 'Controls', 0, 255, lambda x: None)
    cv2.createTrackbar('S_max', 'Controls', 255, 255, lambda x: None)
    cv2.createTrackbar('V_min', 'Controls', 0, 255, lambda x: None)
    cv2.createTrackbar('V_max', 'Controls', 255, 255, lambda x: None)

    # 定义颜色范围和对应的颜色名称及显示颜色
    color_ranges = {
        'red': {
            'ranges': [(0, 50, 50), (10, 255, 255), (160, 50, 50), (179, 255, 255)],  # 红色有两个范围
            'color': (0, 0, 255)  # BGR格式:蓝=0, 绿=0, 红=255
        },
        'green': {
            'ranges': [(35, 50, 50), (85, 255, 255)],
            'color': (0, 255, 0)  # BGR格式:蓝=0, 绿=255, 红=0
        },
        'blue': {
            'ranges': [(100, 50, 50), (130, 255, 255)],
            'color': (255, 0, 0)  # BGR格式:蓝=255, 绿=0, 红=0
        },
        'yellow': {
            'ranges': [(20, 100, 100), (30, 255, 255)],
            'color': (0, 255, 255)  # BGR格式:蓝=0, 绿=255, 红=255
        },
        'white': {
            'ranges': [(0, 0, 200), (180, 30, 255)],
            'color': (255, 255, 255)  # BGR格式:蓝=255, 绿=255, 红=255
        },
        'black': {
            'ranges': [(0, 0, 0), (180, 255, 30)],
            'color': (0, 0, 0)  # BGR格式:蓝=0, 绿=0, 红=0
        }
    }

    # 设置初始滑动条位置为自定义颜色
    cv2.setTrackbarPos('H_min', 'Controls', 0)
    cv2.setTrackbarPos('S_min', 'Controls', 0)
    cv2.setTrackbarPos('V_min', 'Controls', 0)
    cv2.setTrackbarPos('H_max', 'Controls', 179)
    cv2.setTrackbarPos('S_max', 'Controls', 255)
    cv2.setTrackbarPos('V_max', 'Controls', 255)

    print("多颜色同时识别程序已启动")
    print("按键说明:")
    print("- 'q':退出程序")
    print("- 's':保存当前帧和检测结果")
    print("- '+'/'-':调整窗口大小")

    # 循环读取摄像头画面
    while True:
        # 读取一帧图像
        ret, frame = cap.read()

        # 如果读取失败,退出循环
        if not ret:
            print("错误:无法读取摄像头画面")
            break

        # 转换到HSV颜色空间
        hsv = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV)

        # 获取当前滑动条的值(用于自定义颜色检测)
        h_min = cv2.getTrackbarPos('H_min', 'Controls')
        h_max = cv2.getTrackbarPos('H_max', 'Controls')
        s_min = cv2.getTrackbarPos('S_min', 'Controls')
        s_max = cv2.getTrackbarPos('S_max', 'Controls')
        v_min = cv2.getTrackbarPos('V_min', 'Controls')
        v_max = cv2.getTrackbarPos('V_max', 'Controls')

        # 创建自定义颜色掩码
        custom_lower = np.array([h_min, s_min, v_min])
        custom_upper = np.array([h_max, s_max, v_max])
        custom_mask = cv2.inRange(hsv, custom_lower, custom_upper)

        # 创建检测结果图像
        detection_frame = frame.copy()

        # 处理自定义颜色
        contours, _ = cv2.findContours(custom_mask, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
        for contour in contours:
            area = cv2.contourArea(contour)
            if area < 500:  # 忽略太小的轮廓
                continue

            # 绘制轮廓
            cv2.drawContours(detection_frame, [contour], -1, (255, 255, 0), 2)  # 青色

            # 计算轮廓的外接矩形
            x, y, w, h = cv2.boundingRect(contour)

            # 在矩形上方显示"自定义"
            cv2.putText(detection_frame, "Custom", (x, y - 10),
                        cv2.FONT_HERSHEY_SIMPLEX, 0.7, (255, 255, 0), 2)

            # 绘制矩形框
            cv2.rectangle(detection_frame, (x, y), (x + w, y + h), (255, 255, 0), 2)

        # 对每种预定义颜色进行检测
        for color_name, color_info in color_ranges.items():
            # 创建掩码
            if color_name == 'red':  # 红色需要特殊处理(两个范围)
                lower1 = np.array(color_info['ranges'][0])
                upper1 = np.array(color_info['ranges'][1])
                lower2 = np.array(color_info['ranges'][2])
                upper2 = np.array(color_info['ranges'][3])

                mask1 = cv2.inRange(hsv, lower1, upper1)
                mask2 = cv2.inRange(hsv, lower2, upper2)
                color_mask = cv2.bitwise_or(mask1, mask2)
            else:
                lower = np.array(color_info['ranges'][0])
                upper = np.array(color_info['ranges'][1])
                color_mask = cv2.inRange(hsv, lower, upper)

            # 查找轮廓
            contours, _ = cv2.findContours(color_mask, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

            # 处理轮廓
            for contour in contours:
                area = cv2.contourArea(contour)
                if area < 500:  # 忽略太小的轮廓
                    continue

                # 绘制轮廓
                cv2.drawContours(detection_frame, [contour], -1, color_info['color'], 2)

                # 计算轮廓的外接矩形
                x, y, w, h = cv2.boundingRect(contour)

                # 在矩形上方显示颜色名称
                cv2.putText(detection_frame, color_name, (x, y - 10),
                            cv2.FONT_HERSHEY_SIMPLEX, 0.7, color_info['color'], 2)

                # 绘制矩形框
                cv2.rectangle(detection_frame, (x, y), (x + w, y + h), color_info['color'], 2)

        # 显示图像
        cv2.imshow('Original', frame)
        cv2.imshow('Color Detection', detection_frame)

        # 等待按键
        key = cv2.waitKey(30) & 0xFF

        # 处理按键
        if key == ord('q'):
            print("用户退出程序")
            break
        elif key == ord('s'):
            # 创建保存目录
            save_dir = "color_detection_images"
            if not os.path.exists(save_dir):
                os.makedirs(save_dir)

            # 生成文件名
            import time
            timestamp = time.strftime("%Y%m%d_%H%M%S")
            original_filename = os.path.join(save_dir, f"original_{timestamp}.jpg")
            detection_filename = os.path.join(save_dir, f"detection_{timestamp}.jpg")

            # 保存图像
            cv2.imwrite(original_filename, frame)
            cv2.imwrite(detection_filename, detection_frame)
            print(f"已保存图像: {original_filename}, {detection_filename}")
        elif key == ord('+') or key == ord('='):  # '='键和'+'键通常在同一个键位
            # 增大窗口
            current_width = cv2.getWindowImageRect('Color Detection')[2]
            current_height = cv2.getWindowImageRect('Color Detection')[3]
            new_width = int(current_width * 1.1)
            new_height = int(current_height * 1.1)
            cv2.resizeWindow('Original', new_width, new_height)
            cv2.resizeWindow('Color Detection', new_width, new_height)
            print(f"窗口大小增加到: {new_width}x{new_height}")
        elif key == ord('-'):
            # 减小窗口
            current_width = cv2.getWindowImageRect('Color Detection')[2]
            current_height = cv2.getWindowImageRect('Color Detection')[3]
            new_width = int(current_width * 0.9)
            new_height = int(current_height * 0.9)
            cv2.resizeWindow('Original', new_width, new_height)
            cv2.resizeWindow('Color Detection', new_width, new_height)
            print(f"窗口大小减小到: {new_width}x{new_height}")

    # 释放资源
    cap.release()
    cv2.destroyAllWindows()
    print("程序已退出")

if __name__ == "__main__":
    try:
        main()
    except Exception as e:
        print(f"程序发生错误: {e}")
        sys.exit(1)
在 GitHub 上编辑此页
上次更新:
贡献者: wuziqing
Prev
实验01-打开 USB 摄像头
Next
实验03-目标检测