Uppdatering: Utvecklare säger att modellen kan svara på ljud på bara 232 millisekunder, liknande mänsklig svarstid!
OpenAI har återigen imponerat världen med den senaste innovationen, GPT-4o. Denna banbrytande teknologi har förmågan att tolka ljud, bild och text i realtid, något som tidigare endast varit möjligt i sci-fi-filmer. Enligt utvecklarna är modellen extremt snabb och kan ge svar på ljudinput på så snabbt som 232 millisekunder, vilket närmar sig mänsklig svarstid under samtal. Denna prestation öppnar upp en helt ny värld av möjligheter för artificiell intelligens och interaktion mellan människor och maskiner.
Med GPT-4o kan användare förvänta sig en revolution inom konversationella AI-system. Genom att integrera tolkning av ljud, bild och text i realtid kan teknologin potentiellt öka effektiviteten inom kommunikation och automatisering av uppgifter. Denna genombrottsteknik kommer att transformera hur vi interagerar med datorer och maskiner, och skapa en mer sömlös och intuitiv användarupplevelse.
Det är otroligt spännande att se hur teknologin fortsätter att utvecklas och öppna nya dörrar för innovation och framsteg. Med OpenAI:s GPT-4o kommer vi snart att vara på gränsen till en värld där maskiner kan förstå och svara på våra kommandon på ett sätt som förut verkade vara otänkbart. Denna nya era av AI är full av möjligheter och överraskningar, och vi kan bara föreställa oss vad framtiden har i beredskap för oss.
Enligt utvecklaren kan modellen svara på ljudinput på bara 232 millisekunder med ett snitt på 320 millisekunder, vilket ska likna mänsklig svarstid under samtal ...
OpenAI lanserar en ny AI-modell som kommer att ingå i dess chattbot ChatGPT.
Att tala med en dator ska vara som att tala med en människa. Om Open AI:s demonstration av nya modellen GPT-4o är något att gå efter är företaget på väg att ...
OpenAI har lanserat vad de säger är en överlägsen stor språkmodell som kan interagera med människoliknande hastigheter med hjälp av text, röst och visuella ...
God morgon! Open AI släpper en ny AI-modell som kan prata, se och förstå innehållet i video. Presentationen för tankarna till en Hollywood-film.
Den nya modellen ska svara snabbare och billigare än föregångaren.
Open AI presenterade den nya AI-modellen GPT-40 under ett evenemang på måndagen. Modellen ska enligt teknikchefen Mira Murati kunna ha talande ...
Möjliggör interaktion och översättning av rörligt material, ljud, text och bilder utan fördröjning.
Idag hade OpenAI sin vårupdate och de släppte GPT-4o, där x22ox22 står för omni. Omni i det här fallet betyder att ChatGPT själv förstår när och hur den ska ...
OpenAI lanserar en ny AI-modell som kommer att ingå i dess chattbot ChatGPT. Det skriver CNBC.
Den nya språkmodellen ska bland annat kunna tolka ljud, bilder och text i realtid.
OpenAI har presenterat en ny version av Chat GPT som kan föra flytande konversationer i tal, direktöversätta i realtid och se genom kameralinsen.
I Spike Jonzes Oscarsbelönade sci-fi-drama Her från 2013 blir Joaquin Phoenix karaktär förälskad i en digital personlig assistent, vars röst gestaltas av ...
OpenAI:s medgrundare och chefsforskare Ilya Sutskever meddelade under gårdagen att han kommer att lämna företaget. Varför Sutskever lämnar OpenAI finns det ...