생성형 인공지능 종류 - GPT, Diffusion, Autoencoder, GAN

인공지능 확률통계

인공지능 대학생 2024. 11. 12. 23:14

주요 처리 수학식: $$L = -\sum_{i=1}^{N} \log P(y_i | x_i, \theta)$$

학습 방식: GPT는 Transformer 아키텍처를 기반으로 학습됩니다. 학습 과정에서는 다음 단계를 거칩니다:

텍스트 데이터 전처리: 텍스트 데이터를 토큰화하고, 각 토큰에 대한 임베딩을 생성합니다.
평균 분산 손실 함수 (MSE) 최적화: 모델은 주어진 텍스트 입력에 대해 다음 단어를 예측하며, 예측된 단어와 실제 단어 간의 차이를 최소화합니다.
순환 학습: 모델은 자신의 출력을 다시 입력으로 사용하여 반복적으로 학습합니다.

주요 처리 수학식: $$x_t = \sqrt{1 - \beta_t} x_{t-1} + \beta_t \epsilon_t$$

학습 방식: Diffusion 모델은 노이즈를 점차적으로 제거하는 방식으로 이미지를 생성합니다. 학습 과정은 다음과 같습니다:

주요 처리 수학식: $$L = \| x - \hat{x} \|_2^2$$

학습 방식: Autoencoder는 입력 데이터를 압축하여 다시 복원하는 방식으로 학습됩니다. 학습 과정은 다음과 같습니다:

주요 처리 수학식: $$L = \min_G \max_D V(D, G)$$

학습 방식: GAN은 생성자와 판별자의 경쟁을 통해 학습됩니다. 학습 과정은 다음과 같습니다:

생성자 학습: 생성자는 랜덤한 노이즈를 입력으로 받아 실제 데이터와 유사한 데이터를 생성합니다.
판별자 학습: 판별자는 생성자가 생성한 데이터가 실제 데이터인지 판단합니다.
경쟁 학습: 생성자는 판별자가 실제 데이터로 판단되도록 최적화하고, 판별자는 생성자가 생성한 데이터를 실제 데이터로 판단하도록 최적화합니다.