Пробивот во вештачката интелигенција на „Гугл“ им даде крилја на акциите на „Алфабет“


Акциите на „Алфабет“ (Alphabet) се тргуваат на највисоко ниво од август минатата година по најавите на „Гугл“ (Google) за вештачка интелигенција на конференцијата за програмери во средата.

Акцијата се зголеми за околу 5 отсто и се тргуваше близу 118 долари за акција во четвртокот наутро.

На својот I/O настан, „Гугл“ во сопственост на „Алфабет“ објави дека ќе донесе функции за вештачка интелигенција на познатата алатка за пребарување за да ги претвори сложените прашања во едноставни одговори со комбинирање на резултати од повеќе извори.

„Гугл“, исто така, соопшти дека неговиот пакет алатки на работното место како Google Docs наскоро ќе им овозможи на корисниците да креираат нови документи и да пополнуваат табели користејќи вештачка интелигенција. Компанијата, исто така, соопшти дека ќе го направи својот чет-бот „Бард“ (Bard AI) попристапен и наскоро ќе има можност да одговара на различни јазици и слики.

Се чини дека аналитичарите се задоволни што најавите на „Гугл“ ќе го задржат во првите редови во трката за вештачка интелигенција и ќе генерираат поврат за компанијата.

„Остануваме расположени и гледаме на I/O како на настан за чистење што ќе помогне да се намали ‘пречекорувањето на вештачката интелигенција’ … и да се намали тековниот јаз на ‘Гугл’ во однос на конкурентите“, напиша аналитичарот на Морган Стенли, Брајан Новак.

Можеби најинтригантни промени се оние кои се однесуваат на пребарувачот на „Гугл“, кој досега беше единствен производ, но отсега гуглањето ќе биде поделено на две посебни искуства на работа со вештачка интелигенција.

Првиот е класичниот пребарувач на „Гугл“. Почнувајќи од овој месец, луѓето во САД ќе можат да пребаруваат на интернет преку Google Labs, инкубаторот за идеи на компанијата. Благодарение на вештачката интелигенција, овој пребарувач ќе може да ги сумира одговорите за корисникот, без потреба од кликнување на линкови или повлекување информации од Википедија.

Сепак, во својот водечки производ, „Гугл“ сè уште избегнува да резимира некои информации, како што се најновите вести, и секој факт што ќе го презентира ќе биде двојно проверен од неговата вештачка интелигенција пред да биде претставен во веб-прелистувачот „Хром“ (Chrome) на компјутер или во мобилниот телефон на “Гугл“ апликација.

Кои се новините на „Гугл“

Извршниот директор на „Гугл“, Сундар Пичаи, претстави голем број нови функции кои неговата компанија ги разви како одговор на предизвиците што ги носи брзата пенетрација на „ЧетГПТ“ (ChatGPT), како и бројни други системи за вештачка интелигенција.

На конференцијата за програмери на Google I/O во Маунтин Вју, Калифорнија, Пичаи, во двочасовна изведба ги претстави, меѓу другото, новите планови на „Гугл“ за развој на вештачка интелигенција, најновиот телефон во серијата „Пиксел“ (Pixel) на „Гугл“, Pixel 7A, телефон со преклопување Pixel Fold, Tablet и Bard AI.

Посебно внимание на конференцијата привлече презентацијата на најновиот голем јазичен модел PaLM 2, подобрена алатка за разговор на Google Bard, конкурент на ChatGPT на OpenAI. Ќе напојува повеќе од 25 производи и функции на „Гугл“.

Најавен е и „Џемини“ (Gemini), кој треба да биде следниот чекор во развојот на системот PaLM 2.

Акцент на безбедноста и точноста

Акцентот на претставниците на компанијатае дека им е многу важна безбедноста – точноста на одговорите и избегнувањето на грешки и „халуцинации“ на системот, а со тоа и ширење на дезинформации.

„Моделите PaLM 2 се посилни во логиката и расудувањето“, рече Пичаи, истакнувајќи дека добиле обемна обука за научни и математички теми и се способни да разберат повеќе од 100 јазици.

Познато е дека ЧетГПТ е релативно лесно да се измами во решавање едноставни математички и логички проблеми или да почне да „халуцинира“ со исфрлање бесмислени информации. Според Пичаи, PaLM 2 не треба да биде толку несигурен.

PaLM 2 ќе биде достапен во низа различни големини, именувани како Gecko, Otter, Bison и Unicorn. Gecko е толку лесен што ќе работи на мобилни уреди дури и кога се офлајн.

Прилагодени за различни знаења
„Гугл“ го претстави PaLM 2 како цело семејство на модели кои се фино подесени за различно знаење специфични за домен.

На пример, верзијата SEC-PaLM е фино прилагодена за безбедносни критични случаи, што значи дека вештачката интелигенција ќе може да се користи за подобро откривање малициозен софтвер и да им помогне на безбедносните професионалци да ги разберат и да ги решат заканите.

Пичаи истакна дека PaLM 2 може да биде од голема помош за програмерите ширум светот, дури и за оние кои соработуваат со колеги кои зборуваат различни јазици. На пример, програмер во САД кој работи со колега во Јапонија за отстранување грешки на кодот, ќе може да побара од PaLM 2 да ја поправи грешката и да додаде коментари на кодот на јапонски.

Моделот беше обучен на 20 програмски јазици, вклучувајќи ги и најпопуларните како JavaScript и Python, но и Prolog, Verilog и Fortran.

Медицински соработник

Med-PaLM 2 е фино подесен за медицинско знаење.

Меѓу другото, може да синтетизира информации од медицински слики, што би можело да им помогне на радиолозите да ги интерпретираат и да ги соопштат резултатите. Постојат планови за дополнително подобрување на неговите способности за толкување на информации од медицински слики, како што се рендген и мамографи.

Според Пичаи, Med-PaLM 2 во споредба со основниот модел успеал да ги намали грешките во заклучоците за дури девет пати, приближувајќи го до перформансите на клиничките експерти. Така, Med-PaLM 2 стана првиот јазичен модел кој одговара на прашања во стилот на медицинските лиценцирани испити на високо професионално ниво и на крајот треба да стане корисен асистент за медицинските професионалци.

Пичаи истакна дека ова се само некои примери за тоа како моделот може да се користи во специјализирани домени и дека се радува на неговата поширока примена.

„Џемини“ идниот конкурент на ГПТ

Пичаи, исто така, официјално го откри постоењето на „Џемини“, голем модел за машинско учење за кој се шпекулираше во март.

Моделот, кој сè уште е во развој, има за цел да се натпреварува со GPT на OpenAI, кој се напојува со ChatGPT. Gemini би требало да биде подобрување на моделот за машинско учење на Google PaLM 2, кој е напојуван од Bard, ривал на ChatGPT, но и други разговорни AI во производите на „Гугл“.

„Џемини“ би можел да стане еден од најголемите и компјутерски најинтензивните модели на вештачка интелигенција некогаш создадени.

Пичаи на конференцијата рече дека ќе има поголеми способности за „меморија и планирање“ од PaLM 2, иако не наведе детали или не објави датум за лансирање.

Обележување на вештачки креации

Меѓу другото, Пичаи најави алатки за идентификација на вештачки генерирана содржина. Таму тој претстави два клучни пристапи – водени жигови и метаподатоци. Водените жигови ќе вградат информации директно во содржината на таков начин што ќе се задржат дури и ако се направат некои промени во содржината.

Извршниот директор истакна дека „Гугл“ од самиот почеток се фокусирал на интеграција на водени жигови и други вештачки создадени техники за обележување на содржината.

„Ако ја погледнеме синтетичката слика, импресивно е колку реално изгледа“, рече Пичаи, додавајќи: „Можете да замислите колку важно ќе биде ова во иднина“.

Метаподатоците ќе им овозможат на креаторите на содржина да додадат дополнителен контекст на изворните датотеки за да обезбедат повеќе информации за генерираните слики. Пичаи тврди дека сите слики генерирани со вештачка интелигенција ќе носат такви метаподатоци.

„Гугл“ мапи

На конференцијата „Гугл“ најави цела низа новитети кои ќе бидат воведени во постоечките и новите производи.

Така, на пример, Google Maps во избраните градови ќе има нова функција „”Immersive View for Routes” (длабински увид во рутите)“. Ќе ги донесе на едно место сите информации што му требаат на корисникот при патување, вклучувајќи детали со сообраќајни симулации, велосипедски патеки, комплексни раскрсници, паркинзи итн.

Магично уредување на фотографии 

Луѓето секогаш сакаат да променат нешто на фотографиите што штотуку ги направиле. Функцијата Magic Editor на „Гугл“ има вештачка интелигенција која ќе може да се користи за правење посложени уредувања на одредени делови од фотографиите, како што се предниот план или позадината, кои ќе можат да ги пополнат празнините на фотографијата или дури и да ја сменат позицијата на предмет за подобро кадрирање.

„Гугл“, исто така, воведе нова функција наречена Magic Compose, која користи пораки и разговори за препишување текстови во различни стилови. На пример, Magic Compose може да направи пораката да звучи попозитивно или професионално, или да звучи како да е напишана од некој друг, познат писател.

Бард ќе може да генерира слики

„Гугл“ објави дека ќе ја отстрани листата на чекање за Бард и ќе ја направи достапна на англиски јазик во повеќе од 180 земји и територии. Ќе започне и поддршка за јапонски и корејски, а во блиска иднина и за околу 40 јазици.

Способноста на Бард да прикажува слики во неговите одговори е исто така новина.

Дополнително, „Гугл“ се поврза со „Адоб“ (Adobe) за некои можности за генерирање уметност, така што неговите корисници ќе можат да генерираат слики користејќи Firefly, а потоа да ги менуваат со помош на Express.

Работниот простор на Google станува попаметен

Пакетот Workspace на „Гугл“ добива и засилување на вештачката интелигенција што ќе го направи попаметен. Меѓу другото, ќе може автоматски да генерира табели и да создава слики. Новите функции за Slides и Meet вклучуваат можност за пишување на типот на визуелизација што ја барате што ќе ја создаде вештачката интелигенција. Поточно, за Google Meet, ова значи создавање приспособени позадини.

Создавање музика

„Гугл“ воведе и нова музичка алатка за вештачка интелигенција, MusicLM, која го претвора текстот во музика. На пример, ако организирате вечера, ќе можете едноставно да напишете „носталгичен џез за вечера“ и алатката ќе создаде неколку верзии на песната со соодветно расположение.

Универзален преведувач

Меѓу другото, „Гугл“ објави дека тестира нова моќна услуга за преведување која ги преведува видеата на нов јазик додека ги синхронизира говорниците со зборовите на странскиот јазик.

Оваа експериментална услуга зема влезно видео, како што е предавање од онлајн курс првично снимен на англиски, го транскрибира говорот, го преведува, го регенерира говорот на тој јазик, одговарајќи на стилот и тонот, а потоа го уредува видеото за да ги направи усните на говорникот поблиску одговараат на новиот звук.