브렌쏭의 Veritas_Garage

[CS231n] #1. Computer Vision의 역사 본문

[Project_하다]/[Project_공부]

[CS231n] #1. Computer Vision의 역사

브렌쏭 2024. 6. 26. 13:51
https://youtu.be/vT1JzLTH4G4?si=oDmUJARdA8vrvJdI

# 안구의 구조를 모방하며 개발된 카메라를 시작으로, 단순히 구조를 모방하는 것 뿐만 아니라 시각적 인지를 하는 방법에 주목하기 시작했다.

 

# 실험동물의 대뇌피질이나 후두엽에 전극을 연결하고 실험한 결과 물체를 인지하기 위해서 특정 각도의 선, 형태를 각각 받아들이는 요소들이 뉴런 중에 있음을 알게 되었다.

 

# 대략적으로 뇌 / 인지 심리학에서 배우는 내용이었다.

 

# 애초에 '인식'을 하기 이전에 이미지로 부터 각각의 물체를 '구분'하는 것 부터가 난관이었다.


1999 / 2000 년도 :: 기계학습의 시작

- Neural Network, Support Vector Machine 등등의 기술이 발전하면서 최초의 얼굴인식 카메라등이 발매됨

 

- 같은 물체를 다르게 촬영했을 때, 두가지 물체가 동일하다는 것을 어떻게 판단할 것인가?

- - 각각의 특징들을 인식하고 이미지에서 매칭시키는 것이 더 쉽다는 것

 

- Spatial Pyramid Matching

- Support Vector Algorithm(Machine)

 

- Pascal Visual Object Challange: 얼마나 객체 인식 성능이 좋은지를 평가하는 지표

 

- 디지털 카메라등의 보급으로 디지털화 된 고품질 데이터가 급격히 늘어나기 시작함

- - 온라인 판매 플랫폼 (아마존 같은) 에서 상품 정보 이미지를 올리고 카테고리화 하면서 데이터 ++

 

- IMAGENET : 이미지 데이터 안에서 올바른 개체를 분리하고 인식하는 성능을 측정

- - 오류율은 점차 줄어들며 2012년에 드라마틱하게 감소,

- - - Convolutional Neural Networks 알고리즘이 개발된 해라서!


CNN, a.k.a Convolutional Neural Networks

2012년에 AlexNet, 혹은 SuperVision이라고 불리는 방식이 등장하고 늘 최고의 방식은 Neural Networks이 차지함

이후 튜닝, 개선, 컴퓨팅 파워의 향상 등으로 급속한 발전 중

 

1998년에 벨 연구소에서 이미 글자인식을 하기 위해 유사한 방식을 이용했으나, 성능 문제로 실현되지 못함

더더욱 데이터 자체도 매우 부족해서 학습시키기 어려웠음

개체의 부분요소를 표본삼아 연산하는 방식이 유사함을 알수있다

행동 인식의 경우와 2D이미지를 바탕으로 3D 방식으로 인식하는 것 또한 발전하고 있다.

최근의 경우에는 깊이 센서 (Depth Sensor)를 이용해 애초에 깊이 데이터를 내재시키거나 하는 방식도 있음

 

향후 발전 여지가 많으며, 분야 또한 한도 끝도 없다

 

1강 끝.

Comments