#인공지능 엔지니어링

공유하고 싶은 Link 가 있나요?

美 AI 개발자, 다른 나라 개발자 보다 얼마나 더 벌까?…"세계 평균 연봉보다 7000만원↑"

AI포스트(AIPOST)

국내 초급 개발자들이 칼바람이 부는 취업 시장을 견디고 있다. 반면 고급 인재들은 엄청난 연봉을 받을 수 있는 빅테크들의 문을 두드리고 있다. 더불어 성장할 수 있는 기반이나 컴퓨팅 인프라를 고려할 때 고급 인재들이 해외로 나갈 수밖에 없다는 분…

0 p

팔로우

리액션유저

정말 다양한 도구들로 최종 결과를 받기전 AI 파이프라인을 통한 프로세스의 복잡성을 보면 현재 '컨텍스트'를 어떻게 구성하고 최적화해서 처리할 것인지가 제일 큰 관건.더보기 줄이기

프롬프트 엔지니어링에서 컨텍스트 엔지니어링으로 | 요즘IT

YOZM.WISHKET.COM

컨텍스트 엔지니어링(Context Engineering)은 AI 세계에서 핫이슈로 새롭게 떠오른 용어이다. 그 등장과 함께 담론의 초점이 ‘프롬프트 엔지니어링’에서 더 넓고 강력한 개념인 ‘컨텍스트 엔지니어링’으로 이동하고 있다. 토비 루트케는…

3.1 p

팔로우1

리액션유저 4

100억원대 연봉 받는 슈퍼스타급 AI 인재들…링크드인 창업자 "받을 만하다"

AI포스트(AIPOST)

인공지능(AI) 인재들의 몸값이 천정부지로 치솟고 있다. 빅테크들이 AI 인재 확보에 불을 붙인 결과다. 여러 명의 엔지니어·연구자들을 채용하는 것보다 최고급 인력에 집중하는 경향이 두드러지고 있다. AI 엔지니어들의 1년 급여는 300만~700…

2.0 p

팔로우

리액션유저 2

스닙팟은 어떤 서비스인가요?

스닙팟은 #해시태그로 인기 콘텐츠가 모이고 끌올 ⏫ 되는 주제 탐색형 서비스 입니다. 클릭해서 스닙팟에 대해 더 알아보세요.

할루시네이션 문제 해결 접근법. 저는 앤스로픽 방식 찬성!더보기 줄이기

"모르면 모른다고 답하라"… AI 기업들 환각 해결 나섰다 - 매일경제

MK.CO.KR

4.0 p

팔로우1

리액션유저 4

LLM 파인튜닝과 서빙에 최적화된 개발자 플랫폼 서비스 Predibase 입니다. LoRA 파인튜닝 모델을 빠르게 학습시키고, 서비스에 적용할 때 쓰면 딱 좋을듯.더보기 줄이기

Predibase: The Developers Platform for Fine-tuning and Serving LLMs

PREDIBASE.COM

Customize and serve open-source models for your use case that outperform GPT-4—all within your cloud or ours.

3.1 p

팔로우1

리액션유저 4

신규 코드 30% 이상 AI가 작성하지만…구글 CEO "최소 내년까지는 개발자 채용 전망"

AI포스트(AIPOST)

마이크로소프트와 구글이 사내 코드 작성에 인공지능(AI) 도구를 적극 활용하고 있다는 소식이 전해지며 화제가 된 바 있다. 특히 순다르 피차이 구글 최고경영자(CEO)는 자사 소프트웨어의 신규 코드 중 30% 이상을 AI가 생성하고 있다고 밝혔다…

2.4 p

팔로우1

리액션유저 3

와우! 제미나이 2.5 implicit caching 지원 한다고 합니다. 제미나이 2.5 API 사용하는 사람들, 기업들에게 꽤 가격인하 효과가 체감되는 곳들이 많을 것 같은 소식. 제미나이 2.5 는 이제 엄청나게 많은 곳에서 (저역시 주력 사용하게 된..) API 인데요. 워낙 Context 가 크니까 캐싱 효과가 상당할텐데.. 이걸 이제 암묵적으로 지원해준다고!! 원래도 저렴했는데 더 굳..더보기 줄이기

Gemini 2.5 Models now support implicit caching

DEVELOPERS.GOOGLEBLOG.COM

Explore implicit caching – now supported in Gemini 2.5 – bringing automatic cost savings to developers using the Gemini API.

3.1 p

팔로우1

리액션유저 4

AI 에이전트 설계시 유용한 여러가지 패턴들!더보기 줄이기

AI 에이전트 설계를 위한 5가지 디자인 패턴 | 요즘IT

YOZM.WISHKET.COM

AI 기술이 빠르게 진화하면서, 단순한 응답 생성에 그치지 않고 스스로 사고하고 작업을 수행하는 지능형 시스템에 대한 요구가 높아지고 있습니다. 특히 여러 단계의 과정을 조율하고 책임지는 실무자에게는 단순한 챗봇을 넘어선 에이전트 기반 AI 시스…

3.1 p

팔로우1

리액션유저 4

다중 에이전트 시스템, 왜 아직 크게 성능향상이 기대보다 못할까. 라는 주제의 2025.03월 논문입니다. 지금 각광받고 관련 프레임워크는 쏟아지지만, 오히려 fail 되는 경우가 많다고도. 크게 시스템 설계 실패, 에이전트 간 정렬 불량, 검증 및 종료 등으로 구분된다고 하네요. 연구에서 사용된 MAS 로는 대표적인 MAS 5가지 (MetaGPT, ChatDev, HyperAgent, AppWorld, AG2) 가 사용되었습니다. LLM 은 GPT-4o 또는 Claude 3 를 사용했다고 하구요. 150여개 Task 로 테스트 했습니다. 논문상 Fail Rate 가 제일 낮은것은 AG2 (15.2%), 그다음은 MetaGPT (34%) 였고 나머지 3개는 70% 이상 Fail 이었습니다.더보기 줄이기

Paper page - Why Do Multi-Agent LLM Systems Fail?

HUGGINGFACE.CO

Papers arxiv:2503.13657 Why Do Multi-Agent LLM Systems Fail? Published on Mar 17 · Submitted by philschmid on Mar 21 Authors: Mert Cemri…

5.4 p

팔로우1

리액션유저 9

정말 작은데 멀티모달에 function calling 에.. 여러모로 넘 좋네요.더보기 줄이기

Gemma3 쓸만할까?

YouTube - 모두의AI

Gemma3 성능이 매우 인상적입니다. 한글 오픈소스 모델 필요하신 분들은 바로 가져다 쓰셔도 좋겠네요! Agent로 완성하는 RAG도 궁금하시다면?

3.0 p

팔로우1

리액션유저 3

OpenRouter는 다양한 LLM 을 직접 API 로 호출하지 않고 하나의 API 로 호출하면서도 해당 프롬프트에 가장 최적화된 API 로 최적화된 라우팅 을 하면서 비용 효율적인 LLM 호출을 제공하는 서비스 입니다. API Key 하나로 여러 모델을 편하게 쓸 수 있는건 덤. (어떤 LLM 모델로 호출하게 될지 상세 옵션 등으로 어느정도 제한 도 가능. 그리고 사용한 만큼 과금이므로 굳이 비싼 요금제 가입 필요 없음.) 여기에 더해 사실 같은 API 라도 (예를 들어 closed 인 Claude 모델이더라도) 여기저기서 서비스하는데요 (Anthropic 공식, Amazon Bedrock, Google Vertex) 어디가 지금 서버 상태가 쾌적한지 알아서 보고 라우팅 해줍니다. 개인이 api 쓰면 rate limit 문제도 해결되구요. 단, 기본적으로 token 당 원래 최종 model 요금에 더해 추가 과금이 있네요. OpenRouter 에서 5% 더 과금한다고 합니다. 🥲 * 그래서 저렴한거 위주로 쓰면 좋은듯? ㅎㅎ 다양한 LLM 에 대해 한번에 프롬프트를 보내고 비교 할 수 있는 서비스도 제공합니다. OpenRouter 를 쓰지 않아도 각종 LLM 성능을 비교하기에 좋아요. 각종 필터링, 조건, 성능 가격 다 비교해 볼 수 있구요. 그리고 여기서 사용자들이 어떤 모델로 Token 을 많이 잘 사용하고 있는지를 토대로 Ranking 도 볼 수 도 있습니다! 와.. 이거 실질적인 트렌드를 한눈에 볼 수 있네요. 랭킹은 일반 랭킹 뿐 아니라 다양한 용도 (프로그래밍, 롤플레이, 마케팅, SEO, Tech, 번역, 법, 금융, 헬스, 아카데이, Trivia) 별 랭킹도 볼 수 있고 기간 별로 (오늘, 이번 주, 이번달, 트렌딩) 살펴볼 수 있구요. LLM 여러개 비교해서 쓸 때 여기서 먼저 보는걸 추천!… 더보기

OpenRouter

OPENROUTER.AI

A unified interface for LLMs. Find the best models & prices for your prompts

4.0 p

팔로우1

리액션유저 4

앤트로픽 연구원들이 공유해주는 AI 에이전트 개발 팁! 우선 AI Agent 를 도입했을 때 효과적인 일의 종류, 그 이전에 AI Agent 가 일반적인 워크플로우 지정과 어떻게 다른지 그 의미를 먼저 잘 파악하길 권장했어요. 워크플로우와 달리 AI 에이전트는 제어하기 어려운 부분도 있으므로 오류 비용은 상대적으로 낮으면서 복잡한 작업에 어울린다고 합니다. 특히 검색엔진에서 도움이 많이 된다고 하구요. 2025년에는 에이전트가 비즈니스 전반에 채택되면서 반복적인 작업을 자동화할 수 있을 것이라고 기대하구요. 하지만 소비자를 위한 쇼핑 도우미 와 같은 용도로는 여전히 사용이 어렵고 비싸서 기대치를 낮춰야 할 것 같습니다. 구축을 위한 팁. 결과를 측정할 수 있는 방법을 마련해야 한다. 성공적인 피드백을 줄 수 있도록 단순하게 시작해야 한다고.더보기 줄이기

Tips for building AI agents

YouTube - Anthropic

Anthropic’s Barry Zhang (Applied AI), Erik Schultz (Research), and Alex Albert (Claude Relations) discuss the potential of AI agents, com…

3.2 p

팔로우2

리액션유저 5

딥시크 사태로 계속 화제가 되는 최신 모델 증류 방식. $50 달러 라고 하니 확실히 쉽게 더 화제가 되는 듯...더보기 줄이기

스탠포드·워싱턴대 "50달러로 추론 모델 구축...'증류' 방식 적용"

AI타임스

딥시크 등장 이후 저렴한 비용으로 추론 모델을 구축했다는 연구가 이어지는 가운데, 이번에는 50달러(약 7만2800원)로 추론 모델을 훈련했다는 모델이 등장했다. 모델 '증류'에 사용하는 데이터를 선별해 학습 비용을 크게 줄였으며, 모델의 생각하…

3.0 p

팔로우2

리액션유저 3

스탠포드 워싱턴 대에서 $50 로 최신 모델 수준의 성능을 달성할 수 있다고 화제가 되고 있길래 확인해본 소스. 테스트 타임 스케일링 증류 기법을 소개한 논문 오픈소스 입니다. 정말 가볍게 최신 모델 수준을 모사하기에 매우 좋은 방법 같아 보이네요? * 물론 $50 는 과장된 부분이 있습니다.. Base 로 쓰인 오픈웨이트 모델인 Qwen2.5-32B 자체가 워낙 좋은 모델이니까요. 논문: https://arxiv.org/pdf/2501.19393 소스: https://github.com/simplescaling/s1더보기 줄이기