Meta rozgrzewa wyścig zbrojeń sztucznej inteligencji wielkich technologii dzięki nowemu modelowi językowemu

24 lutego (Reuters) – Meta Platforms Inc (META.O) w piątek udostępniła badaczom nowy duży model językowy, podstawowe oprogramowanie nowego systemu sztucznej inteligencji, rozgrzewając wyścig zbrojeń AI, gdy duże firmy technologiczne spieszą się do Zintegruj technologię z ich produktami i przyciągnij inwestorów.

Publiczna bitwa o dominację w przestrzeni technologicznej sztucznej inteligencji rozpoczęła się pod koniec zeszłego roku wraz z uruchomieniem wspieranego przez Microsoft OpenAI ChatGPT i skłoniła wielkich graczy technologicznych od Alphabet Inc (GOOGL.O) do chińskiego Baidu Inc (9888.HK) do trąbienia o własnych siłach. ofiary. .

LAMA firmy Meta, skrót od Large Language Model Meta AI, jest dostępny na licencji niekomercyjnej dla naukowców i organizacji powiązanych z rządem, społeczeństwem obywatelskim i środowiskiem akademickim. Blog.

Duże modele językowe wydobywają ogromne ilości tekstu w celu podsumowania informacji i generowania treści. Mogą na przykład odpowiadać na pytania zdaniami, które można odczytać tak, jakby zostały napisane przez ludzi.

Najnowsze aktualizacje

Zobacz jeszcze 2 historie

Model, który według Meta wymaga „znacznie mniej” mocy obliczeniowej niż poprzednie oferty, został przeszkolony w 20 językach z alfabetem łacińskim i cyrylicą.

„Dzisiejsze ogłoszenie Meta wydaje się być krokiem naprzód w testowaniu ich kreatywnych możliwości sztucznej inteligencji, aby mogli wdrożyć je w swoich produktach w przyszłości” – powiedział Gil Luria, starszy analityk oprogramowania w DA Davidson.

„Generative AI to nowa aplikacja sztucznej inteligencji, z którą Meta ma niewielkie doświadczenie, ale która jest wyraźnie ważna dla przyszłości ich działalności”.

Sztuczna inteligencja okazała się jasnym punktem dla inwestycji w sektorze technologicznym, którego spowolnienie wzrostu spowodowało masowe zwolnienia i ograniczenie wyścigów eksperymentalnych.

Meta powiedział, że LAMA może przewyższyć konkurentów, którzy badają więcej parametrów lub zmiennych, które bierze pod uwagę algorytm.

W szczególności twierdził, że wersja LAMA z 13 miliardami parametrów przewyższyłaby GPT-3, niedawnego poprzednika modelu strukturalnego ChatGPT.

READ  Ksenia Sobczak: prezenterka telewizyjna i była kandydatka na prezydenta opuściła Rosję

Opisał swój model LAMA o 65 miliardach parametrów jako „konkurencyjny” z Google Chinchilla70B i PalM-540B, który jest większy niż model, którego Google użył do zademonstrowania wyszukiwania opartego na czacie Bart.

Rzecznik Meta przypisał wydajność dużej ilości „czystszych” danych i „ulepszeniom architektonicznym” modelu, który poprawił spójność szkolenia.

Meta wypuściła wielkojęzyczny model OPT-175B w maju ubiegłego roku, skierowany do badaczy, który stanowił podstawę nowej iteracji jej chatbota BlenderBot.

Później wprowadzono model o nazwie Galactica, który mógł pisać prace naukowe i rozwiązywać problemy matematyczne, ale szybko wycofał wersję demonstracyjną po uzyskaniu oficjalnie brzmiących niepoprawnych odpowiedzi.

Reportaż Yuvraja Malika i Evy Mathews w Bangalore i Katie Paul w Nowym Jorku; Montaż autorstwa Shailesha Kubera i Granta McCoola

Nasze standardy: Zasady zaufania Thomson Reuters.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *