Meta julkaisee Llama 3.1:n: tähän mennessä tehokkaimman avoimen lähdekoodin tekoälymallin

Meta on ilmoittanut julkaisevansa Llama 3.1:n, sen uusimman ja edistyksellisimmän avoimen lähdekoodin tekoälymallin. Tämä uusi versio edustaa merkittävää harppausta tekoälyteknologiassa, ja Meta väittää, että se on parempi kuin OpenAI:n kaltaisten yritysten johtavat patentoidut mallit.

Lippulaiva Llama 3.1 405B -malli, jossa on 405 miljardia parametria, on nyt suurin julkisesti saatavilla oleva perusmalli. Se osoittaa huippuluokan kyvyt yleistiedossa, matematiikassa, työkalujen käytössä ja monikielisessä kääntämisessä. Mallia opetettiin yli 15 biljoonalla tokenilla käyttämällä yli 16 000 Nvidian H100 GPU:ta.

Yksi Llama 3.1:n tärkeimmistä parannuksista on sen laajennettu kontekstipituus 128 000 tokenilla, mikä on 16 kertaa aiempien Llama-mallien kapasiteetti. Tämä antaa tekoälylle mahdollisuuden käsitellä ja ymmärtää paljon pidempiä tekstin kohtia, mikä parantaa sen kykyä käsitellä monimutkaisia tehtäviä ja tuottaa monipuolisempia vastauksia.

Uusi malli tukee kahdeksaa kieltä: englanti, saksa, ranska, italia, portugali, hindi, espanja ja thai. Tämä monikielinen ominaisuus tekee Llama 3.1:stä monipuolisen työkalun maailmanlaajuisten tekoälysovellusten parissa työskenteleville kehittäjille ja yrityksille.

Meta julkaisee Llama 3.1:n kolmessa koossa: 405B , 70B ja 8B parametrit. Jokainen koko on optimoitu eri käyttötapauksiin:

405B-malli sopii erinomaisesti yrityssovelluksiin ja edistyneeseen tutkimukseen, sillä se pystyy luomaan pitkää tekstiä, monikielistä kääntämistä, koodausta ja monimutkaisia päättelytehtäviä.
70B-malli sopii sisällön luomiseen, keskustelulliseen tekoälyyn ja kielen ymmärtämiseen.
8B-malli on suunniteltu sovelluksiin, joissa on rajoitetut laskentaresurssit, kuten mobiililaitteisiin.

Helpottaakseen käyttöönottoa Meta tekee yhteistyötä suurten teknologiayritysten, kuten Amazonin, Googlen ja Databricksin, kanssa, jotta Llama 3.1 saataisiin saataville eri alustoille. Mallit ovat nyt saatavilla esimerkiksi Amazon Web Servicesissä (AWS) Amazon SageMaker JumpStartin ja Amazon Bedrockin kaltaisten palveluiden kautta.

Mark Zuckerberg, Metan toimitusjohtaja, korostaa avoimen lähdekoodin tekoälyn merkitystä ja totesi, että se on avain tekoälyn etujen demokratisoinnissa. Hän uskoo, että avoimen lähdekoodin mallit, kuten Llama 3.1, ylittävät lopulta omat ominaisuudet ja käyttöönottoasteet.

Llama 3.1:n julkaisu sisältää myös päivitetyn lisenssin, jonka avulla kehittäjät voivat käyttää mallin lähtöjä muiden tekoälyjärjestelmien parantamiseen. Tämän muutoksen odotetaan nopeuttavan tekoälyn innovaatioita ja tarjoavan kehittäjille enemmän joustavuutta tekoälysovellusten rakentamisessa ja mukauttamisessa.

Metan sitoutuminen avoimen lähdekoodin tekoälyyn muistuttaa siitä, kuinka Linuxista tuli hallitseva avoimen lähdekoodin käyttöjärjestelmä monille laitteille ja palvelimille. Yhtiö toivoo, että Llama 3.1:stä tulee samalla tavoin tekoälykehityksen kulmakivi.

Tekoälyn kehittyessä edelleen nopeasti, Llama 3.1:n julkaisu on merkittävä virstanpylväs tehokkaiden tekoälymallien tekemisessä kehittäjien ja yritysten saataville maailmanlaajuisesti. Se luo alustan tekoälyn uudelle aikakaudelle, jossa avoimen lähdekoodin mallit kilpailevat suoraan patentoitujen vastineidensa kanssa ja mahdollisesti ylittävät ne.