카카오브레인은 초거대 모델 학습에 꼭 필요한 이미지 텍스트 7억 건으로 구성된 Coyo를 모두가 자유롭게 사용할 수 있도록 공개했습니다. 카카오브레인 Large-Scale 엔지니어링 팀의 Dylan은 고품질 데이터를 수집하기 위해 사용했던 다양한…
COYO-700M: Large-scale Image-Text Pair Dataset. Contribute to kakaobrain/coyo-dataset development by creating an account on GitHub.
Tasks Text Classification Text Generation Question Answering Token Classification Text2Text Generation Translation Fill-Mask Summarizatio…
스닙팟은 #해시태그로 인기 콘텐츠가 모이고 끌올 ⏫ 되는 주제 탐색형 서비스 입니다. 클릭해서 스닙팟에 대해 더 알아보세요.
• 개발 및 활용을 위한 인프라 서비스 AI 데이터 지능정보산업 인프라 조성사업으로 추진한 AI 학습용 데이터(6개 분야)와 국내외 기관/기업에서 보유한 AI 학습용 데이터를 공개 한국어 영상이미지 헬스케어 재난안전환경 농축수산 교통물류 AI 컴…
카카오브레인이 약 7억4천만 개의 이미지-텍스트로 이루어진 데이터셋 ‘Coyo(이하 코요)’를 오는 31일 카카오브레인 공식 홈페이지를 통해 공개한다. 초거대 AI 개발의 기반이자 기업의 핵심 자산인 데이터셋을 외부에 공개하는 것은 매우 이례적이…
스닙팟은 #해시태그로 인기 콘텐츠가 모이고 끌올 ⏫ 되는 주제 탐색형 서비스 입니다!