Google amână lansarea Gemini, modelul său principal de limbaj mare (LLM) și a concurentului GPT-4 .
Reprezentanții Google le-au spus unora dintre clienții și partenerii din cloud ai gigantului tehnologic că modelul AI nu ar trebui să fie așteptat până în primul trimestru al anului 2024.
Un factor în întârziere a fost incertitudinea dacă Gemini ar putea egala sau depăși cel mai avansat LLM al OpenAI în GPT-4. Având în vedere o mare parte din publicitatea din jurul Gemini au fost tocmai afirmațiile că ar fi superior lui GPT-4 finanțat de Microsoft, acest standard posibil nerespectat sugera că Google dorea mai mult timp pentru a perfecționa produsul.
Intârzierea Gemini a fost, de asemenea, bazată pe dorința de a-și consolida ofertele pentru consumatori cu noua tehnologie bazată pe inteligență artificială înainte de a acorda dezvoltatorilor de software externi acces la aceasta.
Google plănuise inițial să lanseze Gemini până în decembrie. Cu doar două luni în urmă, se pare că s- oferit unui mic grup de companii acces la Gemini, sugerând că era în program pentru a-și îndeplini data de lansare cu planurile raportate de a pune Gemini la dispoziția organizațiilor prin platforma sa Google Cloud Vertex AI.
Potrivit raportului, Google abordează lansarea Gemini cu prudență, inclusiv în ceea ce privește utilizarea Gemini în Bard, răspunsul său la ChatGPT și un LLM mai puțin sofisticat decât Gemini. Bard a făcut o eroare reală într-o demonstrație la începutul acestui an, iar raportul sugerează că eroarea încă se referă la lucrătorii implicați în proiect.
Ce este Gemini?
Prezentat ca AI de vârf la Google, compania a susținut anterior că Gemini are o putere de calcul de cinci ori mai mare decât GPT-4. Google prezintă în mod explicit Gemini ca un concurent direct al ChatGPT-4 de la OpenAI și este instruit pe cipurile avansate TPUv5 de la Google, care pot funcționa cu 16.384 de cipuri simultan.
Gemini poate lucra ca chatbot, poate rezuma text sau poate crea text original pe baza a ceea ce utilizatorilor le place să citească, inclusiv schițe de e-mail sau știri. De asemenea, își propune să ajute dezvoltatorii de software să scrie cod.
În timp ce afirmația Google că puterea de calcul a lui Gemini o depășește pe cea a lui GPT-4 rămâne deocamdată nefondată, iar această întârziere aduce veridicitatea sa mai mult în lumina reflectoarelor.
Gemini a fost proiectat având în vedere procesarea multimodală. Aceasta înseamnă că poate procesa atât imagini, cât și text și s-a susținut că va putea produce imagini și texte sensibile la context ca răspuns la solicitări.
Un alt factor de diferențiere cheie este disponibilitatea de către Google a datelor de formare proprietare. Gemini poate fi instruit în portofoliul extins de servicii și produse ale Google și Alphabet, inclusiv YouTube, Căutare Google, Cărți Google și Google Academic. Acest volum de date proprietare i-ar putea oferi un avantaj față de ChatGPT-4, deoarece își va face răspunsurile mai precise și mai bine informate.
Acea bogăție de date de antrenament, agravată de puterea de calcul (revendicată) care ar accelera dramatic timpii de răspuns și ar introduce beneficiul răspunsurilor vizualizate, ar putea poziționa Gemini ca lider de piață după lansare – dacă se ridică la nivelul hype-ului său.