OpenAI daha hızlı ve ücretsiz GPT-4o modelini piyasaya sürüyor; yeni sesli asistan o kadar doğal konuşuyor ki, bunun sahte olduğunu düşüneceksiniz

İleriye dönük: OpenAI yakın zamanda GPT-4o’yu (GPT-4 Omni veya kısaca “O”) tanıttı. Model, GPT-4’ten “daha akıllı” değildir ancak yine de bazı dikkate değer yenilikler onu diğerlerinden ayırmaktadır: metni, görseli ve işitsel verileri aynı anda işleme yeteneği, sorma ve yanıtlama arasında neredeyse hiç gecikme olmaması ve inanılmaz derecede insan sesi veren bir ses.

Günümüzün chatbot’ları şimdiye kadar yaratılmış en gelişmişlerden bazıları olsa da, hepsi yüksek gecikme sorunu yaşıyor. Sorguya bağlı olarak yanıt süreleri bir saniyeden birkaç saniyeye kadar değişebilir. Apple gibi bazı şirketler bunu cihazdaki yapay zeka işlemeyle çözmek istiyor. OpenAI, Omni ile farklı bir yaklaşım benimsedi.

Pazartesi gösterisi sırasında Omni’nin yanıtlarının çoğu hızlıydı ve sohbeti tipik sohbet robotu oturumlarından daha akıcı hale getirdi. Ayrıca kesintileri nezaketle kabul etti. Sunucu GPT-4o’nun yanıtı üzerine konuşmaya başlarsa yanıtını bitirmek yerine söylediklerini duraklatacaktı.

OpenAI, O’nun düşük gecikme süresini, modelin her üç girdi biçimini (metin, görsel ve ses) işleme yeteneğine borçludur. Örneğin ChatGPT, karışık girdileri ayrı modellerden oluşan bir ağ aracılığıyla işledi. Omni her şeyi işler ve başka bir modelin çıktısını beklemeden bunları tutarlı bir yanıtla ilişkilendirir. Hala GPT-4 “beynine” sahip ancak işleyebileceği ek girdi modlarına da sahip. OpenAI CTO’su Mira Murati bunun norm haline gelmesi gerektiğini söylüyor.

Murati, “GPT-4o, GPT-4 düzeyinde zeka sağlıyor ancak çok daha hızlı” dedi. “GPT-4o’nun bu paradigmayı, bu etkileşimin çok daha doğal ve çok daha kolay hale geldiği işbirliğinin geleceğine gerçekten kaydırdığını düşünüyoruz.”

Demoda en çok Omni’nin sesi (veya sesleri) öne çıktı. Sunum yapan kişi botla konuştuğunda, robot doğal görünen duraklamaların arasına serpiştirilmiş gündelik bir dille yanıt verdi. Hatta kıkırdadı ve ona insani bir nitelik kazandırarak bunun bilgisayar tarafından mı oluşturulduğunu yoksa sahte mi olduğunu merak etmeme neden oldu.

Gerçek uzmanlar ve koltuk uzmanları şüphesiz görüntüleri doğrulamak veya çürütmek için inceleyeceklerdir. Google Duplex’i tanıttığında da aynı şeyin olduğunu gördük. Google’ın dijital yardımcısı sonunda doğrulandı, dolayısıyla sesi Duplex’i utandırsa da aynı şeyi Omni’den de bekleyebiliriz.

Ancak ekstra incelemeye ihtiyacımız olmayabilir. OpenAI, GPT-4o’nun iki telefonda kendi kendine konuşmasını sağladı. Botun iki versiyonunun birbiriyle konuşması, insan benzeri yanılsamayı bir şekilde kırdı. Erkek ve kadın sesleri hala insan sesi gibi gelse de, konuşma daha az organik ve daha mekanik geliyordu; tek insan sesini çıkarırsak bu mantıklı olur.

Demonun sonunda sunucu botlardan şarkı söylemelerini istedi. Robotları düet yapmaları için koordine etmeye çalıştığı ve yanılsamayı bir kez daha bozduğu garip bir an daha yaşandı. Omni’nin son derece coşkulu ses tonunun da biraz ayarlanması gerekebilir.

OpenAI ayrıca bugün macOS için bir ChatGPT masaüstü uygulaması yayınlayacağını ve Windows sürümünün bu yılın sonlarında geleceğini duyurdu. Ücretli GPT kullanıcıları uygulamaya zaten erişebiliyor ve uygulama sonunda belirtilmeyen bir tarihte ücretsiz bir sürüm sunacak. ChatGPT’nin web sürümü halihazırda GPT-4o’yu çalıştırıyor ve modelin de ücretsiz kullanıcılarla sınırlı olarak kullanıma sunulması bekleniyor.

Facebook
Twitter
LinkedIn
WhatsApp
Pinterest
Tumblr

Benzer Haberler

Son Haberler