이 위키에 "대규모 언어 모델" 문서를 만드세요! 찾은 검색 결과도 보세요.
- | 명칭 = 대형 언어 모델 (Large Language Model, LLM) | 대표 모델 = GPT‑3 (1750억 매개변수, Brown et al., 2020) citeturn2search0 · PaLM (2022 ...5 KB (122 단어) - 2025년 4월 21일 (월) 19:31
- * '''Claude-Web''' '''<sup>(AI)</sup>''' - Anthropic의 AI 모델 Claude의 웹 크롤러로, 대화형 인공지능 훈련용 데이터를 수집할 수 있음. ...ai''' '''<sup>(AI)</sup>''' - Cohere의 AI 모델과 연관된 봇으로, 웹상의 텍스트 데이터를 수집하여 언어 모델 훈련에 사용될 수 있음. ...7 KB (288 단어) - 2024년 11월 8일 (금) 22:13
- 2025년 1월, Meta는 자사의 최신 대규모 언어 모델인 Llama 4 시리즈를 출시했다. 출시 직후 LMArena에서 2위라는 높은 순위를 기록하며 주목받았으나, 곧 벤치마크 조작 의 [[LMArena]]는 이 사건에 신속하게 대응했다. 플랫폼은 "Meta의 정책 해석이 우리가 모델 제공업체에 기대하는 바와 일치하지 않았다"고 공식 발표했으며, 2,000개 이상의 일대일 대결 결과를 공개 검토용으로 공개하여 투명성을 ...10 KB (117 단어) - 2025년 5월 29일 (목) 21:19
- | 언어 = {{국기|미국}} 영어 ...가지 핵심 구성 요소로 이루어져 있다. 첫째는 모델 배틀 시스템으로, 사용자가 프롬프트를 입력하면 시스템이 무작위로 선택한 두 개의 언어 모델이 각각 응답을 생성한다. 사용자는 이 두 응답을 익명 상태에서 비교하고, 더 나은 응답을 선택하거나 동점을 줄 수 있다. 이때 모 ...10 KB (355 단어) - 2025년 5월 29일 (목) 13:34
- ...전이 학습(transfer learning) 개념을 NLP에 성공적으로 적용한 사례로 평가받는다. BERT의 등장 이후, 다양한 변형 모델(예: RoBERTa, DistilBERT, ALBERT)이 개발되었으며, 현재까지도 NLP 연구와 응용 분야에서 중요한 기반 기술로 사 기존의 언어 모델(예: Word2Vec, GloVe, ELMo)이나 순차적 모델(예: RNN, LSTM)은 단어의 맥락을 한 방향(왼쪽에서 오른쪽 또는 오른쪽에서 왼쪽)으로만 학습하는 한계가 있었다. 반면, BERT ...14 KB (335 단어) - 2025년 2월 24일 (월) 23:23
- AI 기술이 발전함에 따라 대규모 언어 모델(LLM)은 놀라운 능력을 보여주었지만, 외부 데이터와의 연결이 제한되어 있어 실제 활용 가치가 제한되는 경우가 많았다. 최첨단 AI 모 * 데이터 소스와 AI 모델 간의 상호작용 개선 ...12 KB (274 단어) - 2025년 4월 4일 (금) 12:59
- ...컴퓨팅 인프라, 데이터베이스 서버, 슈퍼컴퓨터 운영 시스템 등 서버 분야에서 중추적인 역할을 담당하고 있다. 안정성과 확장성이 뛰어나 대규모 트래픽을 처리할 수 있으며, 다양한 서버 애플리케이션과의 호환성이 우수하다. 슈퍼컴퓨터와 고성능 컴퓨팅(HPC) 환경에서 리눅스는 주로 사용된다. 복잡한 계산 작업과 대규모 데이터 처리를 효율적으로 수행할 수 있어 과학 연구, 기상 예측, 생물학 연구 등 다양한 분야에서 필수적인 도구로 사용되고 있다. ...27 KB (266 단어) - 2025년 1월 25일 (토) 21:16
- | 항목5 = 언어 == 서비스 모델 == ...15 KB (531 단어) - 2025년 2월 12일 (수) 20:28