연산 회로 배선과 학습 구조 설계

‘어원 구조 기반 Tensor Attention Architecture'

by Ancient GPS

‘어원 구조 기반 Tensor Attention Architecture'

‘어원 기반 Tensor Attention Architecture'

0-7. ‘어원 구조 기반 Tensor Attention Architecture’ 정리


‘어원 구조 기반 Tensor Attention Architecture’/ [*Tensor: Tensor는 벡터를 일반화한 다차원 배열로, 여러 축을 통해 복합적인 구조 정보를 표현할 수 있는 수학적 표현 형식이다. 본 모델에서는 단어를 단일 임베딩 벡터로 표현하는 대신, 어원 단위의 구조적 결합 상태를 유지한 채 어텐션 연산에 투입하기 위한 표현 구조로 사용된다.]


스크린샷 2026-03-06 오후 3.25.45.png
스크린샷 2026-03-06 오후 3.26.09.png
스크린샷 2026-03-06 오후 3.26.24.png
스크린샷 2026-03-06 오후 3.26.34.png
스크린샷 2026-03-06 오후 3.26.49.png
스크린샷 2026-03-06 오후 3.27.00.png
스크린샷 2026-03-06 오후 3.27.15.png
스크린샷 2026-03-06 오후 3.27.24.png
스크린샷 2026-03-06 오후 3.27.40.png
스크린샷 2026-03-06 오후 3.28.06.png
스크린샷 2026-03-06 오후 3.28.14.png
스크린샷 2026-03-06 오후 3.28.28.png
스크린샷 2026-03-06 오후 3.28.40.png
스크린샷 2026-03-06 오후 3.28.51.png


작가의 이전글어원 기반의 언어 모델 연산 회로