北科資工二多媒體技術與應用 第七周個人作業 - 討論適合 yolov4 的情境、yoloV4 解決那些問題,為何被大量使用

筆記說明

此筆記用途在於台北科技大學資訊工程系大二下多媒體技術與應用作業紀錄
並非所有人都適用,部分對我而言稍加容易的內容並不會寫在此內。
這是學習後心得的筆記,可能不太適用會未來的學生

由於我沒有學習過裡面的理論,因此這是資工大二學生透過網路與自身理解的筆記,學習價值並不高、且可能擁有大量錯誤。

請提出一種情境設想適合使用 YOLOv4並寫下原因。

我認為 YOLOv4 很適合用於醫院的人流控制,可以在重要的醫護室、病房、手術房中進行職業辨識,辨識是醫生?護士?或是其他職業。

例如病房的話,我們就可以檢測有多少護士現在在哪裡?哪個病房裡面有幾位護士、幾位家屬,可以讓護理長方便了解現在每個病房有多少護士,哪個病房裡面有過多的家屬,可能引發危險的狀態或不利於護士照顧病人。

請思考 YOLOv4 在近幾年被大量使用的原因,對比HOG與SIFT,YOLOv4 解決了哪些問題

YOLOv4 與 hog、sift 最大的不同為,yolov4 可以在一張圖片中辨識許多物件,且 yoloV4 訓練是透過類神經網路演算法,可讓訓練變得很簡單,前提是要克服環境的設定、colab 的環境後最重要的一環,我們可以透過 labelImg 來對每一個圖像進行人工辨識,連國中生都可以操作。

後兩者則是 SVM,則需要我們去對 kernel、C、gamma 去設定,普通的學生不一定可以找到最適點。
如果是 Sift 則需要提取特徵,還要避免圖片特徵不足的問題。
Hog 則需要我們去思考 block and cell 的問題。

Faster R-CNN,其主要概念如下

  • 捲積層取出特徵
  • ROI 將特徵像似的分類
  • CNN 提取 ROI 的分類
  • softMAX 分類

但還是有些許的缺點,例如我們再提取特徵項似的分類時,我們還是要對每一個分類進行計算,無法省略這步驟,在特徵項似的分類量非常大的時候,計算就會變為更緩慢。

但 Faster R-CNN 提高準確率與速度,實現了點到點檢測目標框架,生成建議框架只需要大約 10s。

  • 版權聲明: 本部落格所有文章除有特別聲明外,均採用 Apache License 2.0 許可協議。轉載請註明出處!
  • © 2020-2024 John Doe
  • Powered by Hexo Theme Ayer
  • PV: UV: