Zrzut ekranu 2024 03 6 o 19.48.38

Najnowszy, zaawansowany model językowy firmy Anthropic, Claude 3, znacząco wyprzedził konkurencję, taką jak ChatGPT czy Google Gemini, ustanawiając nowe standardy w wydajności i możliwościach.

Według Anthropic, Claude 3 nie tylko przewyższył swoich poprzedników, ale osiągnął także „prawie ludzką” sprawność w różnych zadaniach. Firma przypisuje ten sukces rygorystycznym testom i rozwojowi, który zaowocował trzema odrębnymi wariantami chatbota: Haiku, Sonnet i Opus.

Sonnet, silnik chatbota Claude.ai, oferuje niezrównaną wydajność i jest dostępny za darmo po prostym zapisaniu się za pomocą adresu e-mail. Opus, flagowy model, może się poszczycić funkcjonalnością multimodalną, płynnie integrując tekst i obrazy. Dzięki usłudze abonamentowej o nazwie „Claude Pro”, Opus obiecuje zwiększoną efektywność i dokładność, aby sprostać różnorodnym potrzebom klientów.

Podczas procesu oceny badacze mieli na celu ocenę zdolności Opusa do zlokalizowania konkretnych informacji w ogromnym zestawie danych dostarczonych przez użytkowników i późniejszego ich przypomnienia. W scenariuszu testowym znanym jako „igła w stogu siana”, Opus został zobowiązany do odpowiedzi na pytanie dotyczące dodatków do pizzy na podstawie jednego istotnego zdania ukrytego wśród niepowiązanych danych. Zdumiewająco, Opus nie tylko odnalazł poprawne zdanie, ale również wyraził podejrzenie, że jest poddawany testowi.

W testach porównawczych Opus wyłonił się jako lider, prześcigając GPT-4 w rozumowaniu na poziomie studiów wyższych i wyróżniając się w zadaniach związanych z matematyką, programowaniem i odzyskiwaniem wiedzy. Ponadto Sonnet zaprezentował znaczącą szybkość i inteligencję, przewyższając swoich konkurentów:

anthropic claude 3 comparison benchmarks

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *