파일:Llama2 loss tokens pigure.png 문서의 역사

차이 선택: 비교하려는 판의 라디오 버튼을 선택한 다음 엔터나 아래의 버튼을 누르세요.
설명: (최신) = 최신 판과 비교, (이전) = 이전 판과 비교, m= 사소한 편집

2024년 4월 22일 (월)

  • 최신이전 17:052024년 4월 22일 (월) 17:05Gaon12 토론 기여 1,675 바이트 +1,675 Llama 모델의 각 모델별 모델의 크기별 훈련 손실 감소 그래프 [https://arxiv.org/abs/2307.09288 Llama 2: Open Foundation and Fine-Tuned Chat Models] 논문 중 일부<ref name="llama2">{{Cite journal | author = Hugo Touvron and Louis Martin and Kevin Stone and Peter Albert and Amjad Almahairi and Yasmine Babaei and Nikolay Bashlykov and Soumya Batra and Prajjwal Bhargava and Shruti Bhosale and Dan Bikel and Lukas Blecher and Cristian Canton Ferrer and Moya Chen and Guillem Cucurull and David Esiobu and Jude Fernandes and...