본문 바로가기

Computer Science Basics

Percaptron(퍼셉트론)에서 딥러닝까지: 인공신경망의 구조적 기초

딥러닝과 머신러닝 차이는? (feat. Perceptron)

두 기술은 모두 데이터로부터 패턴을 학습하고 예측을 수행한다는 공통점을 가지지만, 내부 구조와 학습 방식에는 뚜렷한 차이가 존재한다. 이 글에서는 머신러닝과 딥러닝의 차이를 설명하고, 딥러닝의 뿌리라고 할 수 있는 퍼셉트론(Perceptron)에 대해 함께 살펴보고자 한다.

머신러닝(Machine Learning)이란

머신러닝은 명시적인 프로그래밍 없이도 데이터를 통해 패턴을 학습하고, 그 결과를 바탕으로 새로운 데이터에 대해 예측하거나 분류하는 기술이다. 주어진 데이터에서 통계적 규칙을 추출하여 모델을 학습시키며, 이를 통해 자동화된 의사결정을 가능하게 한다.

 

머신러닝은 크게 지도 학습(Supervised Learning), 비지도 학습(Unsupervised Learning), 강화 학습(Reinforcement Learning)으로 구분되며, 대표적인 알고리즘으로는 선형 회귀, 의사결정 트리, K-최근접 이웃(KNN), 서포트 벡터 머신(SVM), 랜덤 포레스트 등이 있다.

 

머신러닝 모델은 보통 특징(feature)을 사람이 수동으로 정의한 뒤, 이 특징들을 바탕으로 학습을 수행하는 구조이다. 따라서 입력 데이터를 어떻게 구성하느냐가 모델의 성능에 큰 영향을 미친다.

딥러닝(Deep Learning)이란

딥러닝은 머신러닝의 한 분류로, 인공 신경망(Artificial Neural Network)을 다층으로 쌓은 구조를 기반으로 한다. ‘딥(Deep)’이라는 이름은 은닉층(Hidden Layer)이 여러 개인 신경망 구조에서 유래한 표현이다.

 

딥러닝의 가장 큰 특징은 사람이 직접 정의하지 않아도 모델이 스스로 유용한 특징을 추출할 수 있다는 점이다. 특히 이미지, 음성, 자연어와 같은 비정형 데이터 처리에 강점을 가지고 있으며, 충분한 양의 데이터와 연산 자원이 확보된다면 인간보다 더 높은 수준의 예측 성능을 보이기도 한다.

 

대표적인 딥러닝 구조로는 완전 연결 신경망(Dense Neural Network), 합성곱 신경망(Convolutional Neural Network), 순환 신경망(Recurrent Neural Network), 트랜스포머(Transformer) 등이 있다.

즉,머신러닝과 딥러닝 차이를 요약하자면, "특징을 사람이 직접 정의하느냐, 모델이 자동으로 학습하느냐" 이다.

퍼셉트론(Perceptron): 딥러닝의 출발점

퍼셉트론은 1957년 프랭크 로젠블랫(Frank Rosenblatt)에 의해 제안된 인공 신경망의 가장 기초적인 형태이다. 퍼셉트론은 여러 개의 입력값에 각각 가중치를 곱하고, 그 합을 바탕으로 임계값을 기준으로 출력값을 0 또는 1로 결정하는 이진 분류 모델이다.

 

퍼셉트론의 수식은 다음과 같다.

y = f(w₁x₁ + w₂x₂ + ... + wₙxₙ + b)
여기서 f는 활성화 함수(activation function)이며, 보통 계단 함수(step function)가 사용된다.

퍼셉트론은 직선 하나로 분리할 수 있는 선형 분리 문제(linearly separable problem)는 잘 해결할 수 있지만, XOR 문제와 같은 비선형 문제는 해결하지 못한다는 한계가 있다. 이 한계를 극복하기 위해 다층 퍼셉트론(Multi-Layer Perceptron, MLP)이 등장하였고, 이는 곧 딥러닝으로 발전하게 되었다.

마무리

공부한 것을 저만의 방식으로 작성한 글입니다. 따라서 틀린 정보가 공유될 수도 있으니 참고만 하되 꼭 공식문서를 통해서 공부하시길 바랍니다. 또한 틀린 부분 지적해주시면 감사하겠습니다.