INTERN/Paper Review 15

[논문 리뷰] DeBERTa: Decoding-enhanced BERT with Disentangled Attention

Abstractpre-trained neural language model은 많은 NLP의 성능의 향상을 가져왔다. 해당 논문에서는 두 개의 새로운 기술을 이용하여 BERT와 RoBERTa 모델을 향상시킨 새로운 model architecture DeBERTa (Decoding-enhanced BERT with disentangled attention)를 제공한다. 첫번째로 disentangled attention mechanism이 있다. 이는 Content vector, Position vector 벡터로 나눠서 단어를 표현하고 단어들 사이의 attention weight을 단어의 내용과 상대적인 위치에 따라 각각 disentanlged matrices를 사용해 계산된다. Content vector는..

INTERN/Paper Review 2025.01.03

BERT의 구조 이해하기

논문 리뷰를 끝내고 내가 궁금했던 부분이 완전히 해소가 되지 않아서 다시 찾아서 글을 쓴다. 내 궁금증은 이거다. BERT는 encoder를 여러 개 쌓은 형태인데 자연어를 벡터로 변화시켜주는 역할이 encoder다. 근데 그걸 여러 개 쌓았다고 어떤 결과가 출력되는거지..?  1. encoder는 단순히 벡터로 변화시켜주는 역할이 아니다.먼저 입력 문장의 토큰 간 관계를 학습해서 각 단어가 문장에서 어떤 맥락에 있는지를 학습한다. 따라서 동음이의어가 해당 문장에서 어떤 의미로 사용되었는지를 파악할 수 있다.또한 encoder는 문장을 입력받아 각 단어를 고차원 벡터로 변환한다. 해당 벡터는 단어의 문맥적 의미를 담고 있으며 이후 작업에 사용된다.  2. 왜 encoder만 여러 개 쌓을까?encoder..

INTERN/Paper Review 2024.12.26

[논문리뷰] BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

더보기으하하 논문 한 번 읽기 쉽지 않군요...!!!! 정확하게 모르는 개념들이 너무 많아서 하나 읽고 찾아보고 하나 읽고 공부하고 하는 중입니다.. 크킄.. 저런.>~!! slow but steady~ 를 지향하며.. 오늘도 한 걸 음 ~ 나아가요~   Pre-trained Language Model(사전 학습된 언어 모델)은 대량의 텍스트 데이터를 이용해 미리 학습된 모델을 의미한다. 이 모델은 언어의 규칙, 문맥, 단어의 의미 등을 학습하여 기본적인 언어 이해 능력을 갖추고 있다. 이후 특정 작업, 예를 들면 감정 분석, 기계 번역, 질문 답변 등에 맞춰 fine-tuning을 통해 해당 문제를 풀기 위한 더 specific한 모델이 된다.  BERT나 GPT 같은 모델들이 모두 pre-traine..

INTERN/Paper Review 2024.12.26

RNN, LSTM, GRU 부터 Transformer까지

seq2seq 모델인코더-디코더 구조를 따르며 입력 시퀀스가 주어졌을 때 그에 해당하는 출력 시퀀스를 생성하는 방식으로 작동한다. Encoder에서는 입력 시퀀스를 받아 내부의 고정된 크기의 컨텍스트 벡터로 변환한다. Decoder에서는 encoder에서 생성된 context vector를 받아 출력 seqence를 하나씩 생성한다. RNN(Recurrent Neural Network)입력과 출력을 시퀀스 단위로 처리하는 시퀀스 모델 RNN은 시퀀스 데이터를 처리하기 위해 설계된 신경망 모델이다. 시퀀스 데이터는 순서가 중요한 데이터로 가장 대표적인 예로 자연어 처리에서의 문장이 있다. 한 번에 하나의 데이터를 처리하면서 이전의 데이터를 기억하고 이를 반영하여 결과를 출력한다. 과거의 신경망들은 보통 은..

INTERN/Paper Review 2024.12.24

Multi Agent Reinforcement Learning

https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE09233680위의 논문을 바탕으로 작성한 글이다.. multi agent를 더 자세히 공부하고 싶어서 읽어본다.... 😁 강화 학습(reinforcement learning) 기계학습의 한 영역으로 어떤 환경에서 정의된 agent가 현재의 상태를 인식하여 보상을 최대화하는 방향으로 자신의 행동을 선택하는 것을 말한다. 환경(Environment), 행동(Action), 보상(Reward)로 3가지 요소로 구성되며 과거에는 주로 single agent를 대상으로 많은 연구가 이루어졌다. Agent는 특정 행동을 취한 후 환경의 변화를 관측하여 보상을 받고 그 보상의 크기에 따라 선택한 행동에 대한 결과..

INTERN/Paper Review 2024.12.24