Gemini 2.5 Pro má novinku: Nezabudne, čo ste sa pýtali ani pri dlhom rozprávaní
Gemini 2.5 Pro od Googlu prinesie lepšie pochopenie vo vašich audio konverzáciách s asistentom.
Je to novinka, ktorá sa týka modelu Gemini 2.5 Pro a Flash Text-to-Speech. Lepšie rozpoznávanie by malo viesť k prirodzenejšej konverzácii a to najmä počas dlhšieho trvania.
Všetci, ktorí ste v minulosti skúšali s asistentom konverzovať, ste mohli badať mierny odklon od pôvodnej témy už po niekoľkých minútach. Lepšie bolo začať novú konverzáciu a otázku položiť znova.
Špecialitou budú aj intonačné zmeny, ktoré môžete hlasovým príkazom zadať ešte pred samotnou konverzáciou. Chcete tajuplné rozprávanie? Stačí to asistentovi povedať a tón hlasu prispôsobí.
Dostupnosť Gemini 2.5 Pro
Novinka je dostupná vo viacerých nástrojoch ako Google AI Studio, Vertex AI a postupne sa spúšťa aj v aplikáciách Gemini Live a Search Live. Zachovanie väčšieho kontextového okna v rámci hlasovej konverzácie neznamená, že si asistent bude pamätať všetko, o čom ste sa rozprávali v priebehu niekoľkých dní alebo týždňov. Primárne je funkcia v Gemini 2.5 Pro zameraná na to, aby sa dal viesť dlhý rozhovor a asistent nestrácal už počas niekoľkých desiatok minút kontext.
TTS – Text-to-Speech
Tento systémový komponent nájdete v smartfónoch s Androidom a slúži na všeobecný prevod textu na reč. Z času na čas si môžete všimnúť aj jeho aktualizáciu cez obchod Google Play. Zaujímavé je však to, že po novom prináša viacero tónov a najmä lepšie dodržiavanie štýlu hlasového prejavu.
Postupne si budete môcť všimnúť aj kvalitnejší prevod zložitejších viet a konzistenciu v tónoch na základe obsahu. Už teraz znie tento prevod veľmi prirodzene, no stále obsahuje minimálne v slovenskom jazyku nejaké hlasové nepresnosti.
Netýkajú sa prečítaného obsahu. Ten je zachovaný v poriadku. Nedokonalosť sa prejavuje v akomsi striedaní hlasov, pričom máte pocit, že v priebehu niekoľkých desiatok minút s vami hovoria 3 alebo 4 osoby.
Čítanie dokumentov
Nový model si lepšie udrží tempo ako aj kontrolu nad tónom. To je vhodné pri čítaní dlhých dokumentov, alebo napríklad aj pri prevode elektronických kníh do audio režimu. TTS komponent využíva aj aplikácia Google Knihy, takže v priebehu niekoľkých dní alebo týždňov by ste mali pri funkcii prevodu textu na reč počuť citeľné zlepšenie.
Prečítajte si aj:
Podobné články
Gemini 3: Grafický režim ako konkurencia pre ChatGPT
Tip pre Android: Google Nano Banana prináša revolučné AI obrázky zadarmo
Google NotebookLM: Prináša výrazné rozšírenie AI možností
Apple za novú Siri poriadne zaplatí. Google zarobí miliardu dolárov ročne
Google Mixboard: Revolúcia pri tvorbe AI obrázkov
Nová Siri príde na jar 2026, jej základom bude Google Gemini