ChatGPT-4o on uskomattoman hyvä, se nauraa ja laulaa kanssasi ”videochatissa”

ChatGPT-4o on uskomattoman hyvä, se nauraa ja laulaa kanssasi ”videochatissa”

Jos odotat innokkaasti OpenAI:n uusinta kevätpäivitystä ChatGPT:lle ja toivoisit yrityksen julkaisevan GPT-5:n, olisit pettynyt tässä suhteessa. Mutta se, mitä OpenAI on julkaissut sen sijaan, korvaisi sen.

Yhtiö julkisti äskettäin uusimman lippulaivamallinsa – GPT-4o:n – ja se on inhimillisen innovaation mestariteos. ”o” GPT-4o:ssa tarkoittaa ”omni” ja se on osuva vihje ChatGPT:n uusimmille kaikkialla läsnä oleville ominaisuuksille. Vaikka älykkyys- ja päättelyosissa ei ole juurikaan parantunut GPT-4-malliin verrattuna, uudessa mallissa on dramaattisia parannuksia nopeuteen ja multimodaalisuuteen.

Mitä se tarkoittaa? GPT-4o:ssa on parannetut tekstin, äänen ja näön ominaisuudet. Se voi ymmärtää kuvia ja keskustella niistä paremmin. Mutta jännittävin osa päivityksessä on sen kyky keskustella kanssasi reaaliajassa äänen ja videon välityksellä, mikä johdattaa meidät ihmisen ja koneen vuorovaikutuksen tulevaisuuteen. Useimmat meistä vain kuvittelivat tämän scifimäisen vuorovaikutuksen tekoälyn kanssa. Mutta se on täällä, ja se on jännittävää.

OpenAI:n teknologiajohtaja Mira Murati esitteli yhdessä kahden tutkimusjohtajan kanssa GPT-40:n uusia ominaisuuksia.

Äänimallissa on uskomaton persoonallisuus ja tonaliteetti, joka saa sinut unohtamaan (jonkin aikaa), että olet vuorovaikutuksessa tekoälyn kanssa. Se on pelottavan jännittävää. Vastaukset ovat paljon luonnollisempia ja se jopa nauraa ja teeskentelee punastavansa kuin ihminen.

Demo korosti myös niitä tunteita, joita ChatGPT voi näyttää, kun sitä nimenomaisesti pyydetään: Tarinan kertomisen aikana ChatGPT otti ääneensä enemmän tunteita ja draamaa, vaihtoi robottiääneen ja jopa lauloi kuin musikaalissa, ja se teki sen. kaikki saumattomasti.

Monet käyttäjät sanovat, että ääni muistuttaa heitä Scarlett Johanssonin tekoälystä elokuvasta ”Her”, mutta erityisesti se on sama ääni kuin ChatGPT:llä oli aiemmin. Kaikki ero johtuu tonaalisuuden muutoksista ja joistakin hyvin kohdistetuista nauruista.

Kun yhdistät sen kykyihin nähdä näytön sisältö ja reagoida siihen, se on suorastaan ​​mieleenpainuva. Uusien näkemisominaisuuksiensa ansiosta ChatGPT ei vain pystynyt ymmärtämään asioita, kuten lineaarisia yhtälöitä, vaan se teki varsin räjähdysmäisen työn tulkitaessaan ympäristöä sekä kameran avulla näytettyjä tunteita ihmisen kasvoilla. Voit nyt jopa pelata kivi-paperisaksia ja pyytää ChatGPT:tä erotuomariksi tai viedä haastatteluvalmisteluja ChatGPT:n kanssa askeleen pidemmälle pyytämällä sitä arvostelemaan asuasi, eikä se jätä tekemäsi huonot valinnat huomiotta.

Kaiken kaikkiaan vaikutus on huomattava ja saa melkein uskomaan, että olet vuorovaikutuksessa oikean henkilön kanssa videopuhelun aikana (jos toinen henkilö piti kameransa koko ajan pois päältä).

https://www.youtube.com/watch?v=DQacCB9tDaw

Äänimalli on myös kaiken kaikkiaan parempi kuin tällä hetkellä saatavilla oleva. Dialogi sujuu enemmän kuin luonnollinen keskustelu, jossa sen voi keskeyttää keskellä, se pystyy ymmärtämään ja erottamaan useat äänet ja taustaäänet sekä äänen sävyn.

Teknisellä tasolla se johtuu siitä, että GPT-4o pystyy tekemään kaiken alkuperäisesti, mikä tähän asti vaati kolmea eri mallia: transkriptio, älykkyys ja teksti puheeksi. Nämä parannukset tuovat käyttäjälle mukaansatempaavamman, yhteistyökykyisemmän kokemuksen aiempien mallien latenssien sijaan.

Vaikka GPT-4o:n käyttö on jo alkanut julkaista ilmais- ja Plus-käyttäjille verkkosovelluksessa, uusi äänitila GPT-4o:lla julkaistaan ​​alfaversiona vain ChatGPT Plus -käyttäjille tulevina viikkoina. Myös uusi macOS ChatGPT -sovellus julkaistaan, ja sen käyttöoikeus on tulossa iteratiivisesti ChatGPT Plus -käyttäjiltä alkaen.

Vaikka demo oli varsin vaikuttava, meidän on odotettava nähdäksemme, onko todellinen sovellus yhtä sujuvaa, kun malli vihdoin julkaistaan.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *