DeepSeek-V3-0324 모델이 새롭게 어제 올라왔습니다. MIT 라이센스. 굳.
deepseek-ai/DeepSeek-V3-0324 · Hugging Face
DeepSeek-V3-0324 Features DeepSeek-V3-0324 demonstrates notable improvements over its predecessor, DeepSeek-V3, in several key aspects. R…
애플의 가장 막강한 하드웨어 라인, 맥 스튜디오! 첫 문구에서 부터 요즘 로컬 LLM 에 대한 수요를 의식한듯 "파라미터 수가 6,000억 개를 넘는 대규모 언어 모델(LLM)을 전적으로 메모리에서 구동할 수 있는 막강한 AI 성능" 을 강조하는군요. 언급된 사이즈를 보면 DeepSeek-R1 604B 모델을 타겟팅 한건가.. ㅎㅎ

Apple, Mac 사상 가장 강력한 신규 Mac Studio 공개
Apple은 오늘 M4 Max 및 새로운 M3 Ultra 칩을 탑재해 Mac 사상 가장 강력한 신규 Mac Studio를 공개했다.
딥시크 Open-Source Week Day6 마지막에 공개한 것은? V3/R1 추론시스템 디자인 입니다 😍

DeepSeek-V3/R1 추론 시스템 개요 공개 (feat. DeepSeek OpenInfra)
들어가며 :pytorch:🇰🇷 DeepSeek에서 지난 월요일부터 금요일까지, 하루에 하나씩, 인프라와 관련한 GitHub 저장소를 공개했습니다. 어제(토요일)는 추가로 DeepSeek-V3/R1의 추론 시스템 개요(Inference Syst…
DeepSeek training 용 코드는 아직 공개안했는데요. inference 만 있죠. 그런데 Hugging Face / open-r1 이라는 repository 에서 reproduction 중이군요. ㅋ 아직 work in progress 상태.. 혹시 DeepSeek 에서 조만간 아예 공유 해주려나...?
GitHub - huggingface/open-r1: Fully open reproduction of DeepSeek-R1
Fully open reproduction of DeepSeek-R1. Contribute to huggingface/open-r1 development by creating an account on GitHub.
아니 근데 이 기사에 다음 R2 공개가 그래서 언제라는건지는 안나옴.. 원래는 5월초 였었다고 하네요. 이제 OpenAI 이상으로 다음 발표가 기대되는중...

딥시크, 계획보다 앞당겨 차기 추론모델 R2 공개
딥시크에서, 통크게 오픈웨이트 보다 훨씬 의미있는 오픈소스로 공개를 하고 있어요. 이정도라면 세계 AI 분야에서 정말 엄청난 기여를 한 것!
DeepSeek Open Infra: 5일간 5개의 AI 저장소 오픈소스로 공개 | GeekNews
DeepSeek AI 팀은 AGI 탐구에서 한계를 넘기 위해 노력하고 있음다음 주부터 5개의 저장소를 오픈 소스로 공개할 예정이며, 이는 개발자로서의 작은 진전을 투명하게 공유하기 위함이들은 온라인 서비스의 기본 구성 요소로, 문서화되고 배포되어…
오오... 검열 무력화된 오픈소스라니. ㅋㅋ 퍼플렉시티 잘한다. 굿잡.

퍼플렉시티, ‘중국 검열 무력화’ 딥시크 오픈소스 공개
구글의 대항마로 꼽히는 인공지능(AI) 검색 스타트업 퍼플렉시티가 중국 공산당 검열을 무력화한 딥시크 R1을 오픈소스로 공개했다. 딥시크의 의도와는 별개로 오픈소스이다 보니 중국산 AI의 한계로 꼽히던 검열 문제를 해결한 셈이다. 퍼플렉시티는 지…
딥시크 모델 논문 따라 해봐요.. DeepSeek R1-Zero 과정 중 일부인 1가지 Countdown 예시. 구현해보니 잘 되더라.. https://github.com/Jiayi-Pan/TinyZero
화제의 모델 DeepSeek R1 에 대한 자세한 비주얼 가이드 문서. Cohere NLP Fellow Jay Alammar 가 쓴 글을 신종훈님이 번역한 문서입니다. 차근차근 설명해주는 방식이 좋네요~ 이걸로 DeepSeek-R1이 어떻게 만들어졌는지 한번 살펴보시죠!

DeepSeek-R1에 관한 비주얼 가이드 | Notion
딥시크 R1 논문, R1-Zero 를 만드는 과정의 핵심인 GRPO 내용 함께 봐요.