Meta rozgrzewa wyścig zbrojeń sztucznej inteligencji wielkich technologii dzięki nowemu modelowi językowemu

24 lutego (Reuters) – Meta Platforms Inc (META.O) w piątek udostępniła badaczom nowy duży model językowy, podstawowe oprogramowanie nowego systemu sztucznej inteligencji, rozgrzewając wyścig zbrojeń AI, gdy duże firmy technologiczne spieszą się do Zintegruj technologię z ich produktami i przyciągnij inwestorów.

Publiczna bitwa o dominację w przestrzeni technologicznej sztucznej inteligencji rozpoczęła się pod koniec zeszłego roku wraz z uruchomieniem wspieranego przez Microsoft OpenAI ChatGPT i skłoniła wielkich graczy technologicznych od Alphabet Inc (GOOGL.O) do chińskiego Baidu Inc (9888.HK) do trąbienia o własnych siłach. ofiary. .

LAMA firmy Meta, skrót od Large Language Model Meta AI, jest dostępny na licencji niekomercyjnej dla naukowców i organizacji powiązanych z rządem, społeczeństwem obywatelskim i środowiskiem akademickim. Blog.

Duże modele językowe wydobywają ogromne ilości tekstu w celu podsumowania informacji i generowania treści. Mogą na przykład odpowiadać na pytania zdaniami, które można odczytać tak, jakby zostały napisane przez ludzi.

Najnowsze aktualizacje

Zobacz jeszcze 2 historie

Model, który według Meta wymaga „znacznie mniej” mocy obliczeniowej niż poprzednie oferty, został przeszkolony w 20 językach z alfabetem łacińskim i cyrylicą.

„Dzisiejsze ogłoszenie Meta wydaje się być krokiem naprzód w testowaniu ich kreatywnych możliwości sztucznej inteligencji, aby mogli wdrożyć je w swoich produktach w przyszłości” – powiedział Gil Luria, starszy analityk oprogramowania w DA Davidson.

„Generative AI to nowa aplikacja sztucznej inteligencji, z którą Meta ma niewielkie doświadczenie, ale która jest wyraźnie ważna dla przyszłości ich działalności”.

Sztuczna inteligencja okazała się jasnym punktem dla inwestycji w sektorze technologicznym, którego spowolnienie wzrostu spowodowało masowe zwolnienia i ograniczenie wyścigów eksperymentalnych.

Meta powiedział, że LAMA może przewyższyć konkurentów, którzy badają więcej parametrów lub zmiennych, które bierze pod uwagę algorytm.

W szczególności twierdził, że wersja LAMA z 13 miliardami parametrów przewyższyłaby GPT-3, niedawnego poprzednika modelu strukturalnego ChatGPT.

READ Ksenia Sobczak: prezenterka telewizyjna i była kandydatka na prezydenta opuściła Rosję

Opisał swój model LAMA o 65 miliardach parametrów jako „konkurencyjny” z Google Chinchilla70B i PalM-540B, który jest większy niż model, którego Google użył do zademonstrowania wyszukiwania opartego na czacie Bart.

Rzecznik Meta przypisał wydajność dużej ilości „czystszych” danych i „ulepszeniom architektonicznym” modelu, który poprawił spójność szkolenia.

Meta wypuściła wielkojęzyczny model OPT-175B w maju ubiegłego roku, skierowany do badaczy, który stanowił podstawę nowej iteracji jej chatbota BlenderBot.

Później wprowadzono model o nazwie Galactica, który mógł pisać prace naukowe i rozwiązywać problemy matematyczne, ale szybko wycofał wersję demonstracyjną po uzyskaniu oficjalnie brzmiących niepoprawnych odpowiedzi.

Reportaż Yuvraja Malika i Evy Mathews w Bangalore i Katie Paul w Nowym Jorku; Montaż autorstwa Shailesha Kubera i Granta McCoola

Nasze standardy: Zasady zaufania Thomson Reuters.

Arzu

„Namiętny badacz kawy. Niezależny muzyczny ninja. Nieuleczalny maniak alkoholu”.

Senioralna TV

Meta rozgrzewa wyścig zbrojeń sztucznej inteligencji wielkich technologii dzięki nowemu modelowi językowemu

Najnowsze aktualizacje

Dodaj komentarz Anuluj pisanie odpowiedzi

Rosnące ceny złota: ostrzeżenie ekonomistów!

Byk, Koziorożec, Skorpion rozstają się ze ścieżką! Codzienny komentarz do horoskopu na wtorek, 7 maja 2024 r

Nagroda Honorowa przyznana przez Film Konya – News 7 Polityka

Konyaspor – Fenerbahçe (komentarz na żywo) – Wiadomości sportowe z ostatniej chwili