본문 바로가기

인공지능/딥러닝7

[Object detection] YOLO (you only look once) : Real-Time Object Detection (feat. 동작원리) 지난 시간까지 2 stage detector계열에 대해 알아봤는데 이번시간에는 1 stage detector의 시초인 YOLO에 대해 알아보려고 한다. 📍YOLO (you only look once)의 등장 YOLO는 조셉 레드몬에 의해 2015년 등장하였다. 컨셉은 real time object detection 즉, 실시간 객체 검출이었다. 지난 시간에 설명한 2 stage 계열 같은 경우 객체를 검출하는데 시간이 조금 걸린다. 자율주행 자동차와 같은 실시간으로 사물이 어디에 위치하는지 파악되어야 하는 작업에서는 사용될 수 없다. 2 stage detection 방식의 느린 속도 때문에 이둘을 한 번에 하는 1 stage detection 방식이 나오게 되며 , 그 시초 모델이 YOLO다. YOLO는.. 2023. 1. 7.
딥러닝 Object detection (이미지에서 객체를 검출 하는 방법)(feat. 2 stage detector)- 2 지난 시간에 이어 이번에는 전통적인 Object detection방법이 아닌 딥러닝이 나온 이후를 살펴보자~ 딥러닝 이후로는 1stage detector와 2 stage detector 2가지 방법으로 나뉘게 된다. 📍One stage detector, Two stage detector Object Detection은 지난시간에 설명한 것과 같이 물체를 식별하는 Classification 문제와, 물체의 위치를 찾는 Localization 문제를 합한 것이다. 간단하게 설명해서 1-stage Detector는 이 두 가지 task를 동시에 행하는 방법이고, 2-stage Detector는 이 두 문제를 순차적으로 행하는 방법이다. 이번 시간에는 2 stage detector에 대해 다뤄보려 한다 Obje.. 2022. 12. 3.
딥러닝 Object detection (이미지에서 객체를 검출 하는 방법) (feat 딥러닝 이전) - 1 지난번까지 우리는 CNN에 대해 알아보았다. 이미지를 Classification(분류) 하는 것뿐 아니라 이미지 내부에서 localization(어느 위치에 물체가 존재하는지 구체적인 위치를 특정) 하는 것을 object detection이라고 한다. 오늘은 이 object detection에 대해 알아보자!! 📍이미지에서 사물을 인식하는 방법 이미지 에서 사물을 인식하는 방법에는 크게 4가지가 있다. 먼저 Classification 이라고 불리는 전통적인 분류 문제는 하나의 이미지를 입력으로 받아 해당 이미지가 어떤 것인지 맞추는 것이다. 여기에 Localization 이 추가된 방법은 해당 이미지가 어떠한 것인지 맞추고 추가로 이미지 내에서 객체가 어느 위치에 존재하는지 두 번째 사진과 같이 바운딩 .. 2022. 11. 27.
CNN의 등장과 발전 과정 - 2 (VGGNet, ResNet, DenseNet, EfficientNet) 지난 시간에 이어 이번에는 나머지 CNN 계열을 살펴보자~ ✅VGGNet VGGNet은 2014년 ILSVRC대회에서 2위를 차지한 모델이다. 하지만 Googlenet 보다 구조가 훨씬 간단하여 오늘날까지도 백본 모델로 많이 사용되기에 설명을 하려 한다. VGGNet은 Very deep convolutional networks for large scale image recognition라는 논문 제목과 같이 Network 깊이가 CNN 성능에 어떤 영향을 주는지 알아보기 위해 층을 깊이 쌓는 것에 초점을 맞춘 연구이다. 일반적으로는 레이어층이 깊어지면 깊어질수록 모델의 성능은 좋아진다. (무조건 좋아지는것은 아님.. vanishing gradient와 같은 여러 문제가..ㅎㅎ) VGGNet은 이전 CNN.. 2022. 11. 19.
CNN의 등장과 발전 과정 - 1 (LeNet, AlexNet, GoogleNet) 📌CNN의 등장 CNN은 데이비드 허블(David H. Hubel / 캐나다 신경학자)과 토르스텐 비셀(Torsten Wiesel / 스웨덴 신경학자) 이 두 신경학자는 1959년에 시각피질 구조에 대한 실험을 수행했다. 실험에서는 고양이가 사용되었는데 (그림 1) , 그때 시각피질 안의 많은 뉴런들이 작은 국부 수용 영역 (local receptive field)을 가진다는 결과를 보였다. 즉, 뉴런들이 시야의 일부 범위 안에 있는 시각 자극에만 반응을 한다는 의미다(그림 2). 뉴런의 수용 영역은 서로 겹칠 수 있으며, 이렇게 겹쳐진 영역들이 전체 시야를 이루게 된다. (ps. 두 신경학자 선생님들은 1981년에 대뇌반구의 기능과 시각 정보화 과정에 관한 연구로 노벨 생리학 의학상을 수상했다 역시나 .. 2022. 10. 2.
[DL] 딥러닝 CNN (합성곱 신경망)알고리즘 의 동작원리 이번 시간에는 CNN에 대해 알아보겠습니다. 지난 DNN에서 발생한 overfitting(과적합) 문제에 해결책 중 하나로 나온 것이 CNN이며 computer vision 분야에서 매우 핫하게 사용되는 딥러닝 알고리즘입니다. Overfitting (과적합) 이란 overfitting은 학습 데이터를 과하게 잘 학습하여 새로운 데이터가 들어왔을 때 오히려 낮은 성능을 보이는 것을 말한다. CNN 등장 배경 Convolutional Neural Networks라는 이름은 실제로 Yann LeCun과 팀의 LeNet 설계에서 유래했습니다 (논문: http://vision.stanford.edu/cs598_spring07/papers/Lecun98.pdf) CNN (Convolutional Neural Net.. 2022. 10. 1.