그록도 Grok-1.5V 라는 비전 이미지 (다이어그램, 그래픽, 표 및 사진 이미지 등) 이해력을 가진 멀티모달 모델을 발표했어요. GPT-4V 와 비교해서도 성능이 크게 떨어지지 않는 (더 좋다고 보여지지는 않는) 벤치마킹 결과가 나왔다고.
Connecting the digital and physical worlds with our first multimodal model.
그록도 Grok-1.5V 라는 비전 이미지 (다이어그램, 그래픽, 표 및 사진 이미지 등) 이해력을 가진 멀티모달 모델을 발표했어요. GPT-4V 와 비교해서도 성능이 크게 떨어지지 않는 (더 좋다고 보여지지는 않는) 벤치마킹 결과가 나왔다고.
Grok-1.5 Vision Preview
Connecting the digital and physical worlds with our first multimodal model.