okładka wpisu newsowego Strategiczni.pl

Narzędzia oparte na sztucznej inteligencji służące do pogłębionego researchu wchodzą w kolejną fazę rozwoju. Perplexity ogłosiło znaczącą aktualizację swojej funkcji Deep Research, która od teraz wykorzystuje model Claude 4.5 Opus od Anthropic. Zmiana ta ma na celu poprawę precyzji analitycznej oraz jakości generowanych raportów.

Koniec ery powierzchownych odpowiedzi – czas na Deep Research

Perplexity zintegrowało swoją infrastrukturę wyszukiwawczą z najnowszym modelem Claude 4.5. Celem tej operacji jest usprawnienie procesu wieloetapowego pozyskiwania danych

System nie tylko wyszukuje informacje, ale wykonuje szereg operacji sprawdzających w celu dostarczenia kompleksowej odpowiedzi na złożone zapytania biznesowe i naukowe.

Jednocześnie firma zaprezentowała DRACO (Deep Research Accuracy, Completeness, and Objectivity) – nowy benchmark typu open-source. Służy on do obiektywnej oceny agentów AI pod kątem ich zdolności do prowadzenia rzetelnych badań w rzeczywistych scenariuszach użytkowania, a nie tylko teoretycznej wiedzy encyklopedycznej.

Wyniki testów i wydajność

Aby dowieść skuteczności tego rozwiązania, firma opracowała i udostępniła benchmark DRACO, który ocenia agentów AI w 10 wymagających dziedzinach – od finansów i prawa, po medycynę i projektowanie UX.

W testach obejmujących 100 złożonych zadań, ocenianych według blisko 40 kryteriów przez ekspertów, systemy Deep Research osiągnęły następujące znormalizowane wyniki:

porównanie wyników perplexity deep research

Zauważalną przewagę Perplexity odnotowano zwłaszcza w sektorze technologicznym i prawnym, gdzie precyzja cytowań oraz umiejętność dotarcia do niszowych źródeł (tzw. „Needle in a Haystack”) okazały się kluczowe.

Benchmark oparty na realnych wyzwaniach

W przeciwieństwie do tradycyjnych testów, które często sprawdzają jedynie „wiedzę quizową” lub proste odtwarzanie faktów, DRACO) stawia na realizm. Zestaw testowy został opracowany na podstawie zanonimizowanych, autentycznych zapytań użytkowników funkcji Deep Research.

Jak podkreślają przedstawiciele Perplexity, prawdziwa praca badawcza to nie tylko znajdowanie odpowiedzi, ale przede wszystkim umiejętność syntezy danych z wielu źródeł oraz przeprowadzanie niuansowej analizy. DRACO sprawdza więc zdolność AI do radzenia sobie ze złożonymi, otwartymi zadaniami, które odzwierciedlają faktyczne potrzeby analityków i menedżerów.

Transparentność i open-source

W geście promującym jawność standardów w branży AI, Perplexity udostępniło DRACO w modelu open-source. Każdy zainteresowany – od badaczy po konkurencyjne firmy – ma dostęp do:

  • pełnego zbioru danych (dostępnego na platformie Hugging Face);
  • szczegółowych kryteriów oceny;
  • metodologii badawczej.

Działanie to ma na celu ustanowienie obiektywnego punktu odniesienia dla całej branży, która dąży do stworzenia coraz bardziej autonomicznych agentów badawczych.

Obecna aktualizacja to efekt ewolucji, która rozpoczęła się w lutym 2025 roku wraz z premierą pierwszej wersji Deep Research. Już wtedy narzędzie wprowadziło rewolucyjne podejście: wieloprzebiegowe zapytania oraz system wzajemnej weryfikacji źródeł.

Dziś, wspierane kontraktem chmurowym o wartości ok. 750 mln dolarów, Perplexity pozycjonuje swoje rozwiązanie jako centralny element strategii biznesowej. CEO firmy, Aravind Srinivas, zaznacza, że w sektorach takich jak finanse, gdzie „stawki są wysokie”, nie ma miejsca na błędy – dlatego dokładność danych stała się priorytetem, który ma pozwolić firmie na skuteczną rywalizację z ofertami od Google czy OpenAI.

Skuteczna strategia marketingowa zaczyna się od rzetelnych danych. Jeśli szukasz partnera, który łączy ekspercką wiedzę o SEO z najnowszymi technologiami – jesteśmy do Twojej dyspozycji.

Umów bezpłatną konsultację z ekspertem

Marcin Zieliński

SEO R&D Expert

Pasjonat SEO z ponad 8-letnim doświadczeniem. Choć pracę zaczynał od „klepania” katalogów dla krajalnic do sera, dziś może pochwalić się sukcesami w prowadzeniu kampanii dla znanych brandów na całym świecie. Prywatnie fan kotów, boksu i gier na Game Boya.

Autor

Napisz do nas

Wypełnij to pole
Wypełnij to pole
Wypełnij to pole
Wypełnij to pole

Wyrażam zgodę na przetwarzanie moich danych osobowych.


Wyrażam zgodę na otrzymywanie informacji handlowych.

Uzupełnij wszystkie wymagane pola.

Masz pytania?
Skontaktuj się z nami!

Masz pytania?

Dawid Kasprzyk
CEO

Skontaktuj się