Alibaba의 최신 AI가 여러 벤치마크 테스트에서 Claude의 GPT-3.5를 능가했습니다.

Alibaba의 최신 AI가 여러 벤치마크 테스트에서 Claude의 GPT-3.5를 능가했습니다.

이것은 투자 조언이 아닙니다. 저자는 언급된 주식에 대해 어떠한 입장도 갖고 있지 않습니다.

2024년이 글로벌 인공 지능 경쟁의 강력한 시작을 알리는 가운데, 중국의 거대 기술 기업 알리바바 그룹(Alibaba Group)도 자사의 Qwen 인공 지능 모델의 최신 버전을 발표했습니다. 세계에서 가장 잘 알려진 AI 챗봇인 OpenAI의 ChatGPT 외에도 Meta의 Llama, Amazon 파트너인 Anthropic의 Claude와 같은 다른 모델은 소비자와 기업이 필요에 따라 AI 플랫폼을 선택할 때 선택할 수 있는 몇 가지 옵션입니다.

Alibaba의 최신 Qwen 반복은 Qwen 1.5이며 소셜 미디어 플랫폼 X에서 공유된 벤치마크에 따르면 이 모델은 일부 벤치마크 점수에서 ChatGPT와 Claude를 모두 능가합니다.

Alibaba의 Qwen 1.5가 교육적 유동성을 테스트하는 여러 벤치마크에서 Claude와 ChatGPT를 능가했습니다.

컴퓨터나 스마트폰에서 실행되는 운영체제와 마찬가지로 인공지능 모델도 소프트웨어의 일부입니다. 이를 통해 소프트웨어 엔지니어와 분석가는 성능을 평가할 수 있으며 Alibaba의 최신 Qwen 1.5의 경우 일부 점수에서는 Anthropic의 Claude 및 OpenAI의 ChatGPT보다 성능이 뛰어난 것으로 나타났습니다.

운영 체제를 테스트하는 벤치마크는 명령을 처리하고 애플리케이션을 실행하는 능력을 평가하며, 인공 지능 모델에 대한 벤치마크는 일반적으로 모델의 출력 생성 능력을 테스트하는 데 중점을 둡니다.

그러한 벤치마크 두 가지는 MT-bench와 Alapaca-Eval이며, X에서 공유된 점수는 Alibaba의 Qwen 1.5 변형이 ChatGPT와 Claude를 능가했음을 보여줍니다. MT-bench는 챗봇과의 차별화를 추구할 뿐만 아니라 두 당사자가 빠르게 참여하는 어려운 대화 환경에서 모델이 ‘그 기반을 유지할 수 있는지’ 확인하기 위해 사전 정의된 일련의 질문에 답하는 모델의 능력을 테스트합니다. 서로 서로 함께.

벤치마크 점수에 따르면 Qwen은 MT-bench에서 네 번째로 높은 점수를 받았으며 GPT-4 Turbo와 처음 두 GPT-4 릴리스, 즉 버전 0613 및 0314보다 뒤처졌습니다.

Alapaca-Eval은 참조 모델을 사용하여 인간 상호 작용을 에뮬레이트하고 테스트 중인 AI 모델이 기준에 맞는 결과를 제공하는 정도를 결정하는 벤치마크입니다. 또한 사용자에게 테스트를 추적할 수 있는 리더보드를 제공하며, 오늘의 벤치마크에 따르면 Qwen 1.5의 Alapaca-Eval 성능은 GPT-4 Turbo 및 뉴욕 기반 HuggingFace의 Yi-34B보다 뒤처지는 것으로 나타났습니다.

Qwen1.5는 동종 최대 오픈 소스 모델 중 하나이며 Alibaba의 대규모 컴퓨팅 리소스의 지원을 받습니다. 오픈 소스 소프트웨어와 마찬가지로 오픈 소스 AI는 사용자와 개발자가 모델을 이해하고 자신만의 변형을 만들 수 있도록 코드를 제공합니다. 오늘의 악보에도 등장하는 메타의 라마 역시 오픈소스 모델입니다.

2024년 초 월스트리트와 기업의 AI Earnings 보고서에서 Meta, Microsoft 및 Alphabet과 같은 거대 기술 대기업에 대한 보고서는 모두 AI Meta의 수석 Mark Zuckerberg에 초점을 맞추고 있습니다. 올해 수십만 개의 GPU를 구매하여 전력을 공급할 계획입니다. Llama를 업고 회사 수익 보고에서 임원은 Meta의 컴퓨팅 용량을 강화하기로 한 자신의 결정이 회사의 용량 부족으로 이어진 이전의 감독에 따른 것이라고 설명했습니다.

마찬가지로, 칩 제조업체 및 설계자의 수익 TSMC와 AMD도 경영진이 AI의 미래에 대해 낙관론을 표명했습니다. TSMC 경영진은 회사가 모든 AI 수요를 포착할 수 있는 안정적인 기반을 갖추고 있다고 확신하는 반면, AMD는 AI가 결국 AI가 될 수 있다고 보고 있습니다. 10년이 지나면 수천억 달러의 가치를 갖게 될 것입니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다