Alla nyheter från Open AI:s utvecklarkonferens
OpenAI har introducerat en rad innovationer i sina API-tjänster, inklusive bildigenkänning i GPT-4 Turbo och integrering av DALL·E 3 för bildgenerering.
OpenAI har introducerat en rad innovationer i sina API-tjänster, inklusive bildigenkänning i GPT-4 Turbo och integrering av DALL·E 3 för bildgenerering.
GPT-4 Turbo med bildigenkänning
Den senaste versionen av GPT-4 kan nu behandla bilder i Chat Completions API. Detta möjliggör funktioner som bildbeskrivningar, detaljerad bildanalys och dokumentläsning med figurer. Tekniken används redan av BeMyEyes för att assistera personer med synnedsättning. Utvecklare kan komma åt denna funktion genom att specificera gpt-4-vision-preview i API:et.
DALL·E 3 till Developers
OpenAI har även gjort DALL·E 3 tillgänglig för ChatGPT Plus och företagsanvändare. Detta verktyg kan nu integreras direkt i applikationer och produkter. Företag som Snap, Coca-Cola och Shutterstock har redan använt DALL·E 3 för att generera bilder och design för sina kunder och kampanjer.
Text-till-tal (TTS)
Ett nytt TTS-API erbjuder högkvalitativt tal från text med sex olika röstalternativ. Det finns två modellvarianter: tts-1 och tts-1-hd, där den senare är optimerad för kvalitet.
Modellanpassning och Specialmodeller
OpenAI introducerar ett experimentellt program för finjustering av GPT-4 och ett specialprogram där utvalda organisationer kan samarbeta direkt med OpenAIs forskare för att träna anpassade GPT-4-modeller till specifika domäner.
Prissänkning
Priserna för flera tjänster på plattformen har sänkts, inklusive för GPT-4 Turbo och finjusterade GPT-3.5 Turbo-modeller.
Copyright Shield
OpenAI introducerar även Copyright Shield, en tjänst där de kommer att försvara och täcka kostnader för sina kunder i händelse av upphovsrättsliga krav.
Whisper v3 och Consistency Decoder
Whisper large-v3, den senaste versionen av OpenAIs öppen källkodsmodell för taligenkänning, har lanserats. OpenAI planerar också att integrera Whisper v3 i sin API inom kort.
Assistants API, Retrieval och Kodtolk
OpenAI lanserar Assistants API, som gör det möjligt för utvecklare att bygga agentliknande erfarenheter i sina applikationer. API:et inkluderar nya verktyg som kodtolk och informationshämtning.
GPT-4 Turbo med 128K Kontext
OpenAI presenterar en förhandsvisning av nästa generation av GPT-4 Turbo, som har kunskap om världshändelser fram till april 2023 och en kontextgräns på 128k, vilket möjliggör mer omfattande samtal.