Alla nyheter från Open AI:s utvecklarkonferens

OpenAI har introducerat en rad innovationer i sina API-tjänster, inklusive bildigenkänning i GPT-4 Turbo och integrering av DALL·E 3 för bildgenerering.

Laila Bard

Nov 7, 2023 — 1 min read

OpenAI har introducerat en rad innovationer i sina API-tjänster, inklusive bildigenkänning i GPT-4 Turbo och integrering av DALL·E 3 för bildgenerering.

GPT-4 Turbo med bildigenkänning
Den senaste versionen av GPT-4 kan nu behandla bilder i Chat Completions API. Detta möjliggör funktioner som bildbeskrivningar, detaljerad bildanalys och dokumentläsning med figurer. Tekniken används redan av BeMyEyes för att assistera personer med synnedsättning. Utvecklare kan komma åt denna funktion genom att specificera gpt-4-vision-preview i API:et.

DALL·E 3 till Developers
OpenAI har även gjort DALL·E 3 tillgänglig för ChatGPT Plus och företagsanvändare. Detta verktyg kan nu integreras direkt i applikationer och produkter. Företag som Snap, Coca-Cola och Shutterstock har redan använt DALL·E 3 för att generera bilder och design för sina kunder och kampanjer.

Text-till-tal (TTS)
Ett nytt TTS-API erbjuder högkvalitativt tal från text med sex olika röstalternativ. Det finns två modellvarianter: tts-1 och tts-1-hd, där den senare är optimerad för kvalitet.

Modellanpassning och Specialmodeller
OpenAI introducerar ett experimentellt program för finjustering av GPT-4 och ett specialprogram där utvalda organisationer kan samarbeta direkt med OpenAIs forskare för att träna anpassade GPT-4-modeller till specifika domäner.

Prissänkning
Priserna för flera tjänster på plattformen har sänkts, inklusive för GPT-4 Turbo och finjusterade GPT-3.5 Turbo-modeller.

Copyright Shield
OpenAI introducerar även Copyright Shield, en tjänst där de kommer att försvara och täcka kostnader för sina kunder i händelse av upphovsrättsliga krav.

Whisper v3 och Consistency Decoder
Whisper large-v3, den senaste versionen av OpenAIs öppen källkodsmodell för taligenkänning, har lanserats. OpenAI planerar också att integrera Whisper v3 i sin API inom kort.

Assistants API, Retrieval och Kodtolk
OpenAI lanserar Assistants API, som gör det möjligt för utvecklare att bygga agentliknande erfarenheter i sina applikationer. API:et inkluderar nya verktyg som kodtolk och informationshämtning.

GPT-4 Turbo med 128K Kontext
OpenAI presenterar en förhandsvisning av nästa generation av GPT-4 Turbo, som har kunskap om världshändelser fram till april 2023 och en kontextgräns på 128k, vilket möjliggör mer omfattande samtal.

Google Bard är nu Gemini – premiumvariant lanserad

Google Bard är historia. Nu är det Google Gemini som gäller. Sökjättens svar på chatGPT har fått en rejäl uppdatering. Google har genomfört ett omfattande skifte inom sitt utbud av artificiell intelligens genom att ersätta Bard med en ny version kallad Gemini. Detta steg representerar en del av företagets långsiktiga

Allt du behöver veta om nya Microsoft Copilot

Microsoft har presenterat en rad uppdateringar ett nytt gränssnitt av Copilot som även berikats med bnya funktioner för bildskapande och redigering. Här är allt du behöver veta. Omgörningen av Copilots landningssida introducerar en minimalistisk estetik som prioriterar vitt utrymme och bilder framför text. Denna visuella omvandling, som visas genom en

Så använder du Microsoft Clipchamp: en steg-för-steg-guide

Upptäck hur Clipchamps nya funktion för tystnadsborttagning förenklar ljudredigering för poddare och alla som arbetar med ljud. Från enkel åtkomst och förberedelse av ditt ljudspår till effektiv borttagning av oönskad tystnad och slutlig export, vår guide tar dig igenom varje steg för att optimera dina ljudprojekt med enkelhet och precision.

Microsoft Copilot: En genomgång av priser och funktioner

I mars 2023 introducerade Microsoft sin generativa AI-lösning Copilot, vilket väckte nyfikenhet kring dess kostnad och värde. Här är en genomgång om vad det kostar och vad man får för pengarna 2024. Microsofts prissättning var inledningsvis ett mysterium i "testläget", vilket fick företag att undra om de kunde

Read more

Google Bard är nu Gemini – premiumvariant lanserad

Allt du behöver veta om nya Microsoft Copilot

Så använder du Microsoft Clipchamp: en steg-för-steg-guide

Microsoft Copilot: En genomgång av priser och funktioner