Google ilmoitti äskettäin joukosta päivityksiä Gemini AI -malliinsa, mukaan lukien useita päivityksiä ja uusia malleja. Näistä yksi, joka sai paljon huomiota, oli Gemini Live, multimodaalinen AI-malli, jossa on video- ja ääniominaisuudet.
Siitä lähtien, kun Bard nimettiin uudelleen Geminiksi helmikuussa, tekoälymalli on toiminut Google Assistantin korvaajana Android-laitteissa. Se on kuitenkin melko rajallinen siinä, mitä se voi tällä hetkellä tehdä. Gemini Liven avulla Google pyrkii muuttamaan tämän tarjoamalla tehokkaamman ja monipuolisemman tekoälymallin.
Mikä on Gemini Live?
Google julkisti äskettäin Gemini Liven I/O-kehittäjäkonferenssissaan tarjotakseen käyttäjille paremman tekoälykokemuksen ja ottaakseen vastaan OpenAI:n GPT-4o:n parannetun ChatGPT:n. Gemini Liven avulla käyttäjät voivat käydä luonnollisia ja yksilöllisiä keskusteluja reaaliajassa sen kanssa puheen ja myöhemmin videon avulla.
Uusi tekoälymalli on osa Googlen Project Astraa, joka on hakujättiläisen yritys rakentaa universaali tekoälyavustaja, joka voi käyttää avun antamiseen erilaisia arjen syötteitä. Esimerkiksi Gemini Live voi käyttää tekstiä, älypuhelimen kameran kuvia ja ääntäsi vastatakseen kysymyksiin.
Googlen mukaan uusi luonnollisen kielen malli ei ainoastaan auta käyttäjiä ratkaisemaan ongelmia ja suorittamaan erilaisia toimintoja, vaan myös tuntemaan itsensä täysin luonnolliseksi vuorovaikutuksessa. Käyttäjät voivat käynnistää Gemini Liven napauttamalla puhelimeensa äänikuvaketta, joka näyttää tekoälyn koko näytössä äänen aaltomuototehosteella.
Voit sitten keskustella tekoälyn kanssa aivan kuten todellisen henkilökohtaisen avustajan kanssa. Erinomainen esimerkki siitä, kuinka päivitetty tekoälymalli voi auttaa sinua, kun pyydät sitä auttamaan sinua haastattelun valmistelussa. Gemini Live ehdottaa taitoja, joita voit korostaa, antaa julkisen puhumisen vinkkejä ja paljon muuta.
ominaisuudet
Gemini Live sisältää muutamia ominaisuuksia, jotka tekevät siitä paljon paremman tekoälyavustajan kuin Google Assistant, Applen Siri tai Amazonin Alexa.
Kaksisuuntaiset puhekeskustelut
Gemini Liven avulla voit keskustella sen kanssa ja tarjoaa ihmismäisiä sanallisia vastauksia, jotka johtavat mukaansatempaaviin ja intuitiivisiin keskusteluihin. Voit esimerkiksi kysyä siltä säästä ja se antaa sinulle tarkan ja ytimekän päivityksen.
Smart Assistant -ominaisuudet
Tekoälymalli voi toimia älykkäänä avustajana ja suorittaa tehtäviä, kuten tiivistää sähköpostien tietoja ja päivittää kalenteriasi. Voit esimerkiksi ottaa valokuvan konserttilehtisestä, jolloin Gemini lisää tapahtuman kalenteriisi.
Visuaaliset ominaisuudet
Käyttämällä älypuhelimesi kameraa Gemini Live voi tallentaa videoita reaaliajassa. Näin se tunnistaa esineet ja vastaa niitä koskeviin kysymyksiin. Esimerkiksi, jos suuntaat älypuhelimen kameran kaiuttimeen ja pyydät Geminiä tunnistamaan sen, se kertoo, mikä se on ja jopa tunnistaa sen merkin ja mallin.
Kuinka Gemini Live toimii?
Project Astra voi yhdistää puhe- ja visuaaliset syötteet, mikä tekee niistä helposti ymmärrettäviä tekoälymallissa. Se voi sitten reagoida tietoihin ja tarjota tarvittavaa apua. Kuten OpenAI:n GPT-4o-käyttöinen ChatGPT, Gemini Live on multimodaalinen tekoäly, eikä se luota pelkästään tekstiin syötteenä.
Vaikka Gemini Live käyttää alun perin äänisyötettä tietojen keräämiseen ja analysoimiseen alkuperäisen julkaisun yhteydessä, sitä päivitetään tulevina kuukausina myös käsittelemään ja analysoimaan videoita erittelemällä ne kehys kuvalta paremman ymmärtämisen ja vuorovaikutuksen vuoksi.
Tekoäly voi mukautua eri käyttäjien puhenopeuteen, ja voit jopa keskeyttää sen pyytääksesi selvennystä tai antaaksesi lisätietoja. Sen kyky jäljitellä ihmisten välistä vuoropuhelua voi tarjota kiinnostavamman vuorovaikutuksen. Siten voit keskustella sen kanssa edestakaisin, aivan kuten ihmisavustajan kanssa. Lisäksi voit valita tekoälyn kymmenestä eri äänestä.
GPT-4o vs. Gemini Live
Vaikka sekä GPT-4o että Gemini Live ovat multimodaalisia tekoälymalleja, tällä hetkellä on vaikea nähdä, kumpi toimii paremmin tosielämässä, varsinkin kun kumpikaan ei ole tällä hetkellä julkisesti saatavilla.
Toisin kuin ChatGPT, Gemini Live kuitenkin luottaa muihin tekoälymalleihin, kuten Google Veoon ja Imagen 3:een, tarjotakseen ulostuloa videoiden ja kuvien muodossa. Siitä huolimatta OpenAI:n ja Googlen esittämissä demoissa ChatGPT vaikutti luonnollisemmalta ja uusi GPT-4o-malli pystyi jopa tunnistamaan ja simuloimaan ihmisen tunteita lauluäänien avulla.
Lisäksi se voi mukautua siihen, miten haluat sen vastaavan, mitä Gemini Live ei voi tehdä ainakaan nykyisessä tilassaan.
Gemini Live -saatavuus
Gemini Live on saatavilla Gemini Advanced -tilaajille, joka on AI-chatbotin maksullinen versio. Se otetaan käyttöön lähikuukausina, ja sen odotetaan olevan laajalti saatavilla vuoden loppuun mennessä.
Sovellukset, kuten Google Messages, voivat hyödyntää Gemini Livea täysimääräisesti, jolloin käyttäjät voivat olla vuorovaikutuksessa tekoälyn kanssa suoraan viestintäsovelluksessa.
Gemini Live saattaa olla seuraava suuri päivitys Googlen AI-chatbotiin ja juuri se, mitä se tarvitsee kilpailijoihin, kuten OpenAI:n ChatGPT:hen. Multimodaalisen toiminnallisuuden ja tehokkaiden puheominaisuuksien ansiosta päivitetty malli voi auttaa Googlea menestymään monipuolisen ja luotettavan digitaalisen avustajan toimittamisessa.
Tällä hetkellä Google on vain ilmoittanut tuovansa uuden tekoälymallin maksullisille tilaajille. Vaikka tämä jättää pois ilmaiset käyttäjät, jotka muodostavat valtavan osan Googlen käyttäjäkunnasta, toivomme, että Google muuttaa kantaansa ja päättää laajentaa Gemini Liven saatavuutta.
Vastaa