예상질의 | Notion

Q1. 동물형 분석의 모델 학습은 어떻게 진행했는가?

파이썬 셀레니움으로 웹 크롤링을 해서 총 8가지 동물형 연예인의 사진을 동물당 4명, 사람당 80장 이상의 사진을 수집해 총 약 2500장의 사진으로 모델 학습을 진행했습니다.

Q2. 동물형 분석 모델의 정확도는 얼마인가?

동물형 분석 모델은 배운 것을 활용하고 새로운 시도를 해 보고자, 싸피 2학기의 컨텐츠인 오전 Live 강의 중 09월 13일자의 인공지능 주제의 강의에서 소개된 구글의 Teachable 머신과 Tensorflow.js를 기반으로 제작했습니다. 해당 기술의 서비스상 정확도가 공개되지 않아 정확도를 발표할 수 없는 점 양해드립니다. 그 대신 인턴산타의 다른 컨텐츠인 퀵드로우는 정석적으로 Tensorflow 모델 학습을 진행했고 해당 모델의 정확도는 89.2%입니다.

Q3. 모델의 정확도를 높이기 위해 어떻게 했다고?

파이썬 OpenCV 라이브러리의 cv2.COLOR_RGB2GRAY 함수를 활용해 컬러 사진을 흑백으로 바꾸고, 얼굴형 이외의 요소, 배경이나 옷 등 다른 사물로 학습하는 것을 막기 위해 크롤링한 사진들에서 얼굴만을 남겨두는 편집 과정을 거쳤습니다.

Q4. 사진을 흑백으로 바꾸면 정확도가 높아지는 건가?

컴퓨터는 흑백 정보만으로도 이미지의 패턴, 윤곽, 모양 등의 속성을 충분히 파악할 수 있으며, 같은 사진이라도 흑백일 경우보다 컬러일 경우에 컬러 사진은 색을 표현하는 RGB 값으로 3채널을 가지고 있어 1채널만 가지고 있는 흑백 사진에 비해 데이터 사이즈가 3배가 큰데 해상도도 낮아 학습에 있어 불리하다고 알고 있습니다.

Q1. 퀵드로우의 모델 학습은 어떻게 진행했는가?

구글이 제공하는 약 240GB의 데이터셋을 바탕으로 Tensorflow 라이브러리를 활용해 CNN의 MobileNets 알고리즘을 활용해 학습을 진행했습니다.

Q2. CNN의 MobileNets 알고리즘이 무엇인가? 왜 그걸 선택했는가?

MobileNets은 심층 컨볼루션 신경망의 아키텍쳐입니다. CNN의 네트워크 알고리즘 중에는 ResNet이 가장 흔하게 사용되는데, MobileNet은 ResNet만큼의 방대한 네트워크가 필요하지 않고 보다 빠른 성능을 요구하는 곳에서 사용됩니다. 퀵드로우 모델이 학습하는데 사용한 데이터는 64*64 크기에 색상도 흑백으로 채널 또한 1개 뿐이기에 ResNet과 같은 방대한 연산은 필요없다고 판단해 MobileNet을 선택했습니다.

Q3. CNN의 다른 네트워크에 대해서 아는 것이 있는가? (이딴 게 본선 질문?)

Q4. 퀵드로우 모델의 정확도는 얼마인가?