ગૂગલે એક નવું આર્ટિફિશિયલ ઇન્ટેલિજન્સ (AI) ટૂલ રજૂ કર્યું છે જે વાસ્તવિક વાતચીતની ઝડપે ભાષાંતર કરી શકે છે, જેનાથી તમે અલગ ભાષા બોલતા લોકો સાથે વધુ સ્વાભાવિક રીતે વાતચીત કરી શકશો.
ગૂગલે જેમિની 3.5 લાઇવ ટ્રાન્સલેટનું અનાવરણ કર્યું છે, જે એક નવો ઑડિયો મોડેલ છે જે રીઅલ-ટાઇમ બહુભાષી વાતચીતને વધુ કુદરતી બનાવવા માટે ડિઝાઇન કરવામાં આવ્યો છે. પરંપરાગત અનુવાદ સિસ્ટમથી વિપરીત, જે વારાફરતી ભાષણ પર પ્રક્રિયા કરે છે, જેમિની 3.5 લાઇવ ટ્રાન્સલેટ સતત સાંભળે છે, ભાષાંતર કરે છે અને બોલે છે, જેનાથી વાતચીત થોડીક જ સેકંડના વિલંબ સાથે વહેતી રહે છે, જે કુદરતી ભાષણની પેટર્નને અનુસરે છે.
આ મોડેલ આપમેળે બોલાતી ભાષાઓને શોધી કાઢે છે અને 70 થી વધુ ભાષાઓને સપોર્ટ કરે છે, જે એક જ વાતચીતમાં હજારો ભાષા જોડીઓને સક્ષમ બનાવે છે. ગૂગલના જણાવ્યા અનુસાર, આ ટેકનોલોજી હવે ડેવલપર્સ અને ભાગીદારો માટે ઉપલબ્ધ છે, જેઓ તેને મીટિંગ્સ, કોમ્યુનિકેશન પ્લેટફોર્મ્સ અને મોબાઇલ એપ્લિકેશન્સમાં એકીકૃત કરી શકે છે.
જેમિની 3.5 લાઇવ ટ્રાન્સલેટમાં સૌથી મોટો ફેરફાર એ છે કે અનુવાદ કેવી રીતે થાય છે. એક વક્તા બોલવાનું પૂરું કરે તેની રાહ જોવાને બદલે, જેમિની 3.5 લાઇવ ટ્રાન્સલેટ સતત સ્ટ્રીમિંગ અનુવાદ કરે છે. આના પરિણામે ઓછા અણગમતા વિરામ, વિક્ષેપો અને વિલંબ સાથે વધુ પ્રવાહી વાતચીતનો અનુભવ થાય છે.
આ મોડેલ રોજિંદા સંદેશાવ્યવહારની વાસ્તવિકતાઓ માટે બનાવવામાં આવ્યું છે. ગૂગલે જણાવ્યું હતું કે તે ઘોંઘાટવાળા વાતાવરણમાં પણ કામ કરી શકે છે અને તેને બેકગ્રાઉન્ડ અવાજો, ઓવરલેપિંગ અવાજો અને અનૌપચારિક ભાષણની પેટર્નને સંભાળવા માટે ડિઝાઇન કરવામાં આવ્યું છે. આ તેને ગ્રાહક સપોર્ટ કોલ્સ, માર્ગદર્શિત પ્રવાસો, વર્ગખંડો, રાઇડ-શેરિંગ સેવાઓ અને લાઇવ પ્રસારણ સહિતના ઉપયોગના વ્યાપક ક્ષેત્રો માટે યોગ્ય બનાવે છે.
ગૂગલ ભાષણની ગુણવત્તા પર પણ ભાર મૂકી રહ્યું છે. સામાન્ય સિન્થેટિક અવાજ બનાવવાને બદલે, સિસ્ટમ મૂળ વક્તાની બોલવાની રીત, ગતિ, ઉચ્ચારણ અને ભાવનાત્મક સ્વર જેવા તત્વોને જાળવી રાખવાનો પ્રયાસ કરે છે. આ અનુવાદિત ભાષણને વધુ કુદરતી લાગે છે અને વાતચીતને સમજવામાં સરળ બનાવે છે.