Ano ang mga API ng pagkilala sa imahe, at ano ang maaari nilang gawin para sa iyo? Tatanggalin ng artikulong ito kung ano ang pagkilala sa imahe, kung ano ang ginagawa ng isang API, at kung paano ito makakatulong sa iyo o sa iyong negosyo na makakuha ng higit pa sa internet. Ang pagkilala sa imahe ay may malaking potensyal para sa mga negosyo at para sa mga indibidwal na mga gumagamit ng internet na may kapansanan.
Ano ang isang API ng pagkilala sa imahe?
Ang pagkilala sa imahe ay kung saan ang isang piraso ng software ay nakakakita ng mga katangian ng isang imahe at tumpak na nauugnay ito. Halimbawa, kung nag-upload ka ng isang imahe ng isang Ferrari 458 sa isang API ng pagkilala sa imahe, dapat itong kilalanin na ito ay isang kotse at na ito ay (o dapat ay) pula. Depende sa API, ang karagdagang pag-uuri ay maaaring posible depende sa uri ng imahe na iyong ginagamit.
Ito ay maaaring mukhang napaka-simple - ang mga tao ay maaaring tumingin sa isang larawan at sabihin sa iyo kung ano ito ay isang larawan ng hindi sinusubukan, halos lahat ng oras - ngunit ito ay isang mahirap na problema na magturo sa mga computer upang malutas. Napakaraming trabaho ang napag-isipan kung paano maiintindihan ng isang computer kung ano ang hitsura ng mga bagay, at gumawa kami ng malalaking hakbang, mula sa kakayahang gumawa ng mga baligtad na paghahanap ng imahe sa sikat na network ng Deep Dream ng Google.
Ang isang API ay isang Application Program Interface. Ito ay mahalagang isang middleman sa pagitan ng mga gawain sa programa na nagsasabi sa isang elemento kung paano magtrabaho sa isa pa, o nagbibigay ng mga tool na kailangan nila upang maisagawa ang isang function. Mayroong dose-dosenang mga uri ng API na maaaring makamit ang lahat ng mga uri ng mga layunin, gamit ang isang saklaw ng mga wika sa programming. Sa kontekstong ito, ang isang API ng pagkilala sa imahe ay ang tool na maaari mong gamitin upang ma-access ang malalim na kapangyarihan ng pagkatuto ng ilang mga komersyal na sistema ng pagkilala sa imahe.
Kailangan mo ng maraming kapangyarihan ng computing upang maisagawa ang pagkilala sa imahe. Kailangan mo ng masa ng data at ang kapangyarihan upang bigyang kahulugan ang lahat. Karamihan sa mga gumagamit ay hindi magkaroon ng napakalaking mapagkukunan upang makabuo ng kanilang sariling malalim na machine ng pag-aaral. Ang mga malalaking pangalan tulad ng Google's Vision API, ang Face API ng Microsoft, ImageNet, at iba pa ay mayroong tulad na mga makina at pinapayagan ang pag-access sa kanila sa pamamagitan ng mga API, alinman nang libre o para sa isang bayad. Pinapayagan nito ang mga negosyo ng lahat ng laki na ma-access ang kapangyarihang ito at makakuha ng mga bagong karanasan ang mga gumagamit.
Paano mababago ang pagkilala sa imahe sa aming karanasan sa internet?
Ang magkakaibang mga gumagamit ng internet ay makakakuha ng iba't ibang mga pakinabang mula sa pagkilala sa imahe. Tingnan natin ang isang may-ari ng hypothetical na may-ari ng website at isang hypothetical na gumagamit upang makita kung paano makikinabang ang magkabilang panig.
Ang mga benepisyo sa negosyo ng pagkilala sa imahe
Bilang isang halimbawa, sabihin nating nagpapatakbo ka ng isang portal na nagbebenta ng sarili na katulad ng Etsy o isang dating website. Nais mong pamahalaan ang kalidad at pagiging angkop ng lahat ng mga imahe na na-upload ng mga gumagamit. Nais mong hadlangan ang lahat ng mga may sapat na gulang o hindi angkop na mga imahe at pagsunud-sunurin ang mga ito sa naaangkop na mga kategorya, ngunit hindi mo maaaring marahil gawin itong lahat sa pamamagitan ng kamay.
Ipasok ang API ng pagkilala sa imahe. Maaari mong gamitin ang API, kasama ang isang angkop na makina ng pagkilala sa imahe, upang mai-scan ang bawat solong imahe at tukuyin ito sa pamamagitan ng mga itinakda na pamantayan. Kaya maaari mong i-scan ang library ng mga larawan para sa mga hindi magagandang imahe at tanggalin ang mga ito. Maaari mong mai-scan ang mga imahe at pag-uri-uriin ang mga naglalaman ng pagkain sa kategoryang "pagkain" at niniting na kategorya sa "lana" na kategorya. Kapag sinabi mo sa API kung ano ang gagawin, awtomatiko ang proseso.
Mayroon ding mga pagkakataon dito para sa pinalaki na katotohanan at interactive na imahe at video. Maaari mong gamitin ang pagkilala sa imahe upang magkaroon ng isang programa na kilalanin ang mga bagay sa totoong mundo. Halimbawa, maaari kang kumuha ng larawan ng isang pares ng mga sneaker na may sinusuot sa kalye. Kung kinikilala ng programa ang mga sneaker, ang larawan ay maaaring dagdagan ng isang link upang bilhin ang mga ito para sa iyong sarili. Nakikinabang ang negosyong ito (nag-aalok ito ng agarang pagkakataon sa pagbebenta) at nakikinabang sa gumagamit (nakukuha nila ang nais nila ngayon).
Ang mga benepisyo ng gumagamit ng pagkilala sa imahe
Ang halimbawa ng sneaker sa itaas ay isang malinaw na paraan lamang na makikinabang ang mga gumagamit mula sa pagkilala sa imahe. Ang ibig sabihin ng Augmented reality ay maaari naming agad na ma-access ang mga pagsusuri, impormasyon ng presyo, at maraming data sa pamamagitan lamang ng pagkuha ng larawan ng isang produkto. Na nagbibigay sa mga gumagamit ng napakalaking halaga ng data upang matulungan silang gumawa ng isang desisyon sa pagbili.
Si Mark Zuckerberg ay nagbubuo ng isang madalas na hindi napapansin na benepisyo sa pagkilala sa imahe sa kanyang pagsasalita sa AI mas maaga sa taong ito. Natanaw niya ang isang API ng pagkilala sa imahe na nagtrabaho sa bulag o bahagyang nakikita ng mga tao na maaaring "basahin" ang isang imahe at ilarawan kung ano ang nakikita nang malakas. Maaaring magkaroon ito ng napakalaking repercussions para sa mga may kapansanan sa mga gumagamit ng internet - o, na may pinalaki na katotohanan, sa totoong mundo ng ilang oras sa linya.
Ang pagkilala sa imahe ay gumaganap din ng isang bahagi sa kaligtasan ng sasakyan. Ang bagong autonomous na pagpepreno at pag-iwas sa mga teknolohiya ng pag-iwas ay ipinakilala ng trabaho na katulad sa mga API na pinag-uusapan natin. Ilang beses silang nag-scan at tinatasa ang mga imahe nang maraming beses sa isang segundo upang mapanatili kang ligtas at ang iyong sasakyan habang nasa kalsada. Ang teknolohiyang ito na nagsasabi sa mga awtonomous na kotse kung ano ang nasa paligid nila.
Ang mga API sa pagkilala sa imahe ay hindi magbabago sa aming sariling karanasan sa internet. Nagtatrabaho sila sa tabi ng umiiral na teknolohiya upang magdagdag ng isang layer ng pakikipag-ugnay at paglulubog sa mundo na nakikita natin. Habang ang mga halimbawa ng artikulong ito ay limitado, may malaking potensyal sa paglalaro, pelikula, industriya ng auto, tingi, libangan, at anumang industriya na pinagana ng teknolohiya. Ito lamang ang simula ng kung ano ang makakamit ng mga intelektwal na sistema!