JimmyHHua
diff --git a/‎README.md
Lines changed: 6 additions & 1 deletion b/‎README.md
Lines changed: 6 additions & 1 deletion
diff --git a/‎README_CN.md
Lines changed: 6 additions & 1 deletion b/‎README_CN.md
Lines changed: 6 additions & 1 deletion
diff --git a/‎python/code_121/README.md
Lines changed: 71 additions & 0 deletions b/‎python/code_121/README.md
Lines changed: 71 additions & 0 deletions
diff --git a/‎python/code_121/guinea_pig.jpg
128 KB b/‎python/code_121/guinea_pig.jpg
128 KB
diff --git a/‎python/code_121/opencv_121.py
Lines changed: 25 additions & 0 deletions b/‎python/code_121/opencv_121.py
Lines changed: 25 additions & 0 deletions
diff --git a/‎python/code_122/README.md
Lines changed: 83 additions & 0 deletions b/‎python/code_122/README.md
Lines changed: 83 additions & 0 deletions
diff --git a/‎python/code_122/dog.jpg
140 KB b/‎python/code_122/dog.jpg
140 KB
diff --git a/‎python/code_122/guinea_pig.jpg
128 KB b/‎python/code_122/guinea_pig.jpg
128 KB
diff --git a/‎python/code_122/opencv_122.py
Lines changed: 43 additions & 0 deletions b/‎python/code_122/opencv_122.py
Lines changed: 43 additions & 0 deletions
diff --git a/‎python/code_122/result.jpg
91.6 KB b/‎python/code_122/result.jpg
91.6 KB
@@ -158,4 +158,9 @@ code_116 | [Decision Tree Algorithm](python/code_116)   | ✔️
 code_117 | [Image Mean-shift Segmentation](python/code_117)   | ✔️
 code_118 | [Grabcut-Image Segmentation](python/code_118)   | ✔️
 code_119 | [Grabcut-Background Change](python/code_119)   | ✏️
-code_120 | [Qrcode detect and decode](python/code_120)   | ✏️
+code_120 | [Qrcode detect and decode](python/code_120)   | ✏️
+code_121 | [DNN- Read the information of each layer of the model](python/code_121)   | ✔️
+code_122 | [DNN- Realize image classification](python/code_122)   | ✔️
+code_120 | [DNN- Model runs to set the target device and compute the background](python/code_123)   | ✔️
+code_120 | [DNN- SSD Single Image Detection](python/code_124)   | ✔️
+code_120 | [DNN- SSD Real-time Video Detection](python/code_125)   | ✔️
@@ -157,4 +157,9 @@ code_116 | [决策树算法](python/code_116)   | ✔️
 code_117 | [图像均值漂移分割](python/code_117)   | ✔️
 code_118 | [Grabcut-图像分割](python/code_118)   | ✔️
 code_119 | [Grabcut-背景替换](python/code_119)   | ✏️
-code_120 | [二维码检测识别](python/code_120)   | ✔️
+code_120 | [二维码检测识别](python/code_120)   | ✔️
+code_121 | [DNN- 读取模型各层信息](python/code_121)   | ✔️
+code_122 | [DNN- DNN实现图像分类](python/code_122)   | ✔️
+code_120 | [DNN- 模型运行设置目标设备与计算后台](python/code_123)   | ✔️
+code_120 | [DNN- SSD单张图片检测](python/code_124)   | ✔️
+code_120 | [DNN- SSD实时视频检测](python/code_125)   | ✔️
@@ -0,0 +1,71 @@
+## 读取DNN模型各层信息
+
+### 概述
+ ✔️ OpenCV的DNN模块支持下面框架的预训练模型的前馈网络(预测图)使用：
+- Caffe
+- Tensorflow
+- Torch
+- DLDT
+- Darknet
+
+同时还支持自定义层解析、非最大抑制操作、获取各层的信息等。
+OpenCV加载模型的通用API为:
+```
+cv2.dnn.readNet(model,  # 模型
+            	config = "", 
+            	framework = "" )
+```
+其中：
+- model二进制训练好的网络权重文件，可能来自支持的网络框架，扩展名为如下：
+
+    - *.caffemodel (Caffe,http://caffe.berkeleyvision.org/)
+    - *.pb (TensorFlow, https://www.tensorflow.org/)
+    - *.t7 | *.net (Torch, http://torch.ch/)
+    - *.weights (Darknet, https://pjreddie.com/darknet/)
+    - *.bin (DLDT, https://software.intel.com/openvino-toolkit)
+
+- config针对模型二进制的描述文件，不同的框架配置文件有不同扩展名：
+
+    - *.prototxt (Caffe, http://caffe.berkeleyvision.org/)
+    - *.pbtxt (TensorFlow, https://www.tensorflow.org/)
+    - *.cfg (Darknet, https://pjreddie.com/darknet/)
+    - *.xml (DLDT, https://software.intel.com/openvino-toolkit)
+
+- framework显示声明参数，说明模型使用哪个框架训练出来的。
+
+### 代码
+```python
+import cv2
+import numpy as np
+
+bin_model = "bvlc_googlenet.caffemodel"
+protxt = "bvlc_googlenet.prototxt"
+
+# load CNN model
+net = cv2.dnn.readNet(bin_model, protxt)
+
+# 获取各层信息
+layer_names = net.getLayerNames()
+
+for name in layer_names:
+    id = net.getLayerId(name)
+    layer = net.getLayer(id)
+    print("layer id : %d, type : %s, name: %s"%(id, layer.type, layer.name))
+
+print("successfully")
+```
+>输出
+```
+layer id : 1, type : Convolution, name: conv1/7x7_s2
+layer id : 2, type : ReLU, name: conv1/relu_7x7
+layer id : 3, type : Pooling, name: pool1/3x3_s2
+layer id : 4, type : LRN, name: pool1/norm1
+layer id : 5, type : Convolution, name: conv2/3x3_reduce
+layer id : 6, type : ReLU, name: conv2/relu_3x3_reduce
+layer id : 7, type : Convolution, name: conv2/3x3
+layer id : 8, type : ReLU, name: conv2/relu_3x3
+layer id : 9, type : LRN, name: conv2/norm2
+layer id : 10, type : Pooling, name: pool2/3x3_s2
+...
+successfully
+```
@@ -0,0 +1,25 @@
+import cv2
+import numpy as np
+
+bin_model = "../model/google/bvlc_googlenet.caffemodel"
+protxt = "../model/google/bvlc_googlenet.prototxt"
+
+# Load names of classes
+# classes = None
+# with open("classification_classes_ILSVRC2012.txt", 'rt') as f:
+#     classes = f.read().rstrip('\n').split('\n')
+
+# print(classes)
+
+# load CNN model
+net = cv2.dnn.readNet(bin_model, protxt)
+
+# 获取各层信息
+layer_names = net.getLayerNames()
+
+for name in layer_names:
+    id = net.getLayerId(name)
+    layer = net.getLayer(id)
+    print("layer id : %d, type : %s, name: %s"%(id, layer.type, layer.name))
+
+print("successfully loaded model...")
@@ -0,0 +1,83 @@
+## DNN实现图像分类
+
+### 概述
+
+ ✔️ 我们使用ImageNet数据集支持1000分类的GoogleNet网络模型， 结合opencv实现图像分类标签预测。
+
+>label标签是在一个单独的文本文件中读取。
+
+读取模型的API：
+```python
+cv2.dnn.readNetFromCaffe(prototxt,
+                         caffeModel = String())
+```
+其中：
+- prototxt表示模型的配置文件
+- caffeModel表示模型的权重二进制文件
+
+使用模型实现预测的时候，需要读取图像作为输入，网络模型支持的输入数据是四维的输入，所以要把读取到的Mat对象转换为四维张量，OpenCV的提供的API为如下：
+
+```python
+cv2.dnn。blobFromImage(
+                        image,
+                        scalefactor = 1.0,
+                        size = Size(),
+                        mean = Scalar(),
+                        swapRB = false,
+                        crop = false,
+                        ddepth = CV_32F 
+)
+```
+其中：
+- image输入图像
+- scalefactor 默认1.0
+- size表示网络接受的数据大小
+- mean表示训练时数据集的均值
+- swapRB 是否互换Red与Blur通道
+- crop剪切
+- ddepth 数据类型
+
+### 代码
+```python
+import cv2
+import numpy as np
+
+bin_model = "bvlc_googlenet.caffemodel"
+protxt = "bvlc_googlenet.prototxt"
+
+# 加载类别
+classes = None
+with open("classification_classes_ILSVRC2012.txt", 'rt') as f:
+    classes = f.read().rstrip('\n').split('\n')
+
+# 加载模型
+net = cv2.dnn.readNetFromCaffe(protxt, bin_model)
+
+# 读取输入数据
+image = cv2.imread("guinea_pig.jpg")
+blob = cv2.dnn.blobFromImage(image, 1.0, (224, 224), (104, 117,123), False, crop=False)
+result = np.copy(image)
+
+# 运行模型
+net.setInput(blob)
+out = net.forward()
+
+# 获取最高分的类别
+out = out.flatten()
+classId = np.argmax(out)
+confidence = out[classId]
+
+# 输出运行时间
+t, _ = net.getPerfProfile() #返回值是网络执行推断的时间
+label = 'cost time: %.2f ms' % (t * 1000.0 / cv2.getTickFrequency())
+cv2.putText(result, label, (0, 20), cv2.FONT_HERSHEY_SIMPLEX, 0.8, (255, 255, 0), 2)
+
+# 显示结果
+label = '%s: %.4f' % (classes[classId] if classes else 'Class #%d' % classId, confidence)
+cv2.putText(result, label, (0, 60), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 255), 2)
+
+show_img = np.hstack((image, result))
+```
+>输出豚鼠的预测结果
+
+![result]('./result.jpg')
@@ -0,0 +1,43 @@
+import cv2
+import numpy as np
+
+bin_model = "../model/google/bvlc_googlenet.caffemodel"
+protxt = "../model/google/bvlc_googlenet.prototxt"
+
+# Load names of classes
+classes = None
+with open("../model/google/classification_classes_ILSVRC2012.txt", 'rt') as f:
+    classes = f.read().rstrip('\n').split('\n')
+
+# load CNN model
+net = cv2.dnn.readNetFromCaffe(protxt, bin_model)
+
+# read input data
+image = cv2.imread("guinea_pig.jpg")
+blob = cv2.dnn.blobFromImage(image, 1.0, (224, 224), (104, 117,123), False, crop=False)
+result = np.copy(image)
+cv2.imshow("input", image)
+
+# Run a model
+net.setInput(blob)
+out = net.forward()
+
+# Get a class with a highest score.
+out = out.flatten()
+classId = np.argmax(out)
+confidence = out[classId]
+
+# Put efficiency information.
+t, _ = net.getPerfProfile()
+label = 'cost time: %.2f ms' % (t * 1000.0 / cv2.getTickFrequency())
+cv2.putText(result, label, (0, 20), cv2.FONT_HERSHEY_SIMPLEX, 0.8, (255, 255, 0), 2)
+
+# Print predicted class.
+label = '%s: %.4f' % (classes[classId] if classes else 'Class #%d' % classId, confidence)
+cv2.putText(result, label, (0, 60), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 255), 2)
+
+show_img = np.hstack((image, result))
+cv2.namedWindow('demo', cv2.WINDOW_NORMAL)
+cv2.imshow("demo", show_img)
+cv2.waitKey(0)
+cv2.destroyAllWindows()