Amikor a mesterséges intelligencia témakörével kezdünk el foglalkozni, előkerülnek különböző fogalmak: gépi tanulás, mély tanulás, gépi látás, szövegfeldolgozás, neurális hálózatok stb. Annak érdekében, hogy megfelelő alapunk legyen a mesterséges intelligencia különböző áginak pontos értésére, nagyon fontos, értelmezési szempontból megfelelő pozícióba helyezen az ide kapcsolódó fogalmakat.

Ugyanis nem mindegy egy probléma megoldásának folyamatában, hogy a neurális hálózatokra szövegfeldolgozás, előrejelzés, vagy képek azonosítása során gondolunk.

Mesterséges intelligencia

Ahhoz hogy megértsük a mesterséges intelligencia, mint fogalom, ténylegesen mennyire általános és sok mindent magába foglaló divatos kifejezés, érdemes egy rövid részt a történelmi áttekintésnek szentelni.

Nos, ahogy a név azt sugallja, a mesterséges intelligencia (MI), melyet angolul AI-nek (Artificail Intelligence) neveznek, egy módszer, melynek segítségével egy adott számítási platform intelligenssé tehető.

Nehéz elképzelni, hogy egy számítógép vagy egy robot képes legyen különböző feladatok végrehajtására, úgy ahogy azt ember is teszi? Az MI a számítástechnika egyik olyan ága, amelyben a programozási módszerekkel tesszük intelligenssé a gépeket.

A mesterséges intelligencia úttörője, megalkotója, John McCarthy szerint a mesterséges intelligencia az intelligens gépek és intelligens számítógépes programok megalkotásának mérnöki módszere és tudománya.

Intuíció és motiváció az MI mögött

Két szóval: emberi agy. A mesterséges intelligencia alapja és logikája az emberi agy alapján származtatható. Az agy az emberiség valaha volt legkomplexebb és legerősebb eszköze a környezetből érkező jelek feldolgozására és az azokra történő strukturált válaszadásra.

A titkos összetevő, ami az emberi fajt a legintelligensebbé tesz az a neocortex (agykéreg legfejlettebb része, más néven isocortex, vagy új agykéreg). A neocortex segítségével vagyunk képesek gondolkodni, cselekedni vagy emlékezni.

A Te agyadon belül is például a neocortiális memória felelős a képek és az időbeli és térbeli minták tárolásáért. Amikor ezek a képekhez vagy mintákhoz hasonló jelek érkeznek az agyba, előhívásra kerülnek.

Az agy, a tárolt és a megfigyelt események hasonlítja össze, valamint előre jelzi, mire kell figyelni, hallgatni, hogyan kell cselekedni az adott szituációban. Amikor a becslés helyes, az ember komfortosan érzi magát, de meglepetés érzését váltja ki, amikor a jóslat helytelen.

Az emberi agy a környezetből érkező jelek feldolgozása és válaszadás szempontjából nagy számítási teljesítményből fakadó előnnyel rendelkezik az integrált áramkörökhöz képest. Ezen differencia csökkenésének eredményeként került a felfedezésének 50. évfordulója után a középpontba újra.

A következő táblázat jól szemlélteti, hogy az informatika és processzorgyártás töretlen fejlődésének ellenére még mindig milyen különbségek is vannak az emberi agy és egy modern processzor között.

Emberi agy (felnőtt)Processzor (Intel Core 2)
Terület2 500 cm290 mm2
Szerkezetamorfkristályos
Részelemek20 milliárd neuron
240 000 milliárd szinapszis
0.291 milliárd tranzisztor
Méretekneuron: 15 um
szinapszis: 1 um
tranzisztor: 65 nm
Számítási kapacitás30 000 milliárd / mp25 milliárd / mp
Felhasznált energia12 W60 W
Művelet / Joule2 500 milliárd0.4 milliárd

Azonban napjainkban szinte korlátlan mértékben és olcsón áll rendelkezésre számítási kapacitás. Ennek eredményeként a megfelelő algoritmusok használata esetén az emberi reakciókkal hasonló feldolgozási és reagálási idővel rendelkeznek az MI-vel felszerelt rendszerek.

Talán elég ennyi tudomány.

Gyakorlati esetek

Ha egy kicsit visszakanyarodunk a mesterséges intelligencia működésének megértéséhez, talán mindenki emlékszik rá, amikor 4-5 évesen megtanulta az ábécé betűit, később ezekből szavakat, majd mondatokat formált. Ahogy az ember öregszik, kezdetben játétkos formában tanul a környezetből.

Amikor élete során többször elesik egy kisgyerek, az agya fokozatosan megtanulja milyen tényezőkre kell fókuszálni annak érdekében, hogy ez többször ne történjen meg. Gyakorlatilag a fenti példával megegyező módon zajlik az MI rendszerek jelfeldolgozási és tanulási folyamata is.

Ezen intuíció alapján az emberek a 20. században azt gondolták a számítógépeket is képessé lehet tenni adatok alapján összefüggések kialakítására, illetve hogy megfelelő számítási kapacitás esetén, a már megtanult információk alapján döntéshozatalra.

Talán a legjobb egy mondatos összefoglalót a Wikipédia alapján mondhatjuk a mesterséges intelligenciáról: gépek által demonstrált intelligencia, azaz bármely olyan eszköz, mely észleli a környezetét és úgy cselekszik, hogy maximalizálja a siker elérésének lehetőségét

Szükség van intelligens gépekre?

Az egyik legfontosabb ok, amiért szükségünk van MI-re, az a ember által elhagyható feladatok automatizálása. Ne felejtsük el, hogy a számítógépek sokkal kiszámíthatóbban működnek és másodperc tört része alatt képesek bármely számot összeszorozni, mely feladat az ember számára komoly fejtörést okozhat.

Hasonlóképpen, egy számítógépet megtanítunk adatok, nyilvántartások alapján, az ott tárolt információk felhasználásával megjósolni a jövőbeli kimeneteleket, a gép az emberi agyhoz hasonlóan képes felismerni az adatok mintáit és struktúráját.

Következzen egy egyszerű példa. Tegyük fel, hogy van egy, az emberi agyról készült nem megfelelő minőségű, életlen MRI felvétel. Az orvosok számára ez a felvétel használhatatlan, mivel nem képesek megfelelő, pontos diagnózis felállítani bizonytalan adatok alapján.

Ebben az esetben életmentő lehet egy mesterséges intelligencia, mely a gyakorlatban egy számítógépes program. A program képes a korábban megtanult felvételek alapján, a kialakított algoritmusa segítségével az eredeti kép élességét és felbontását megnövelni, ami már használható információval szolgál az orvosok számára.

Léteznek már olyan orvosi alkalmazásai is a MI-nek, mely segítségével ultrahangos vagy MRI képek alapján tumorokat, elváltozásokat képes felismerni. A legnagyobb csavar a történetben az, hogy már most meghaladja az MI programok becslési hatékonysága, a tanult és tapasztalt orvosok eredményeit

Mesterséges intelligencia főkategóriák

Ahhoz, hogy pontosan értsük mit is jelent a mesterséges intelligencia, tudni kell milyen alkalmazási lehetőségek jelentik a részeit. Az MI definiálása során 7 fő kategóriát állapítunk meg a soron következő ábra szerint.

A mesterséges intelligencia 7 főkategóriája és a fontosabb alkategóriák.
A mesterséges intelligencia 7 főkategóriája és a fontosabb alkategóriák.

Gépi tanulás

1. Gépi tanulás (Machine learning): a mesterséges intelligencia egyik szerteágazó és bonyolult része, ahol adatok és matematikai modellek segítségével történik a kitűzött feladatok megoldása. Legfőbb programozási nyelve a Python, amelyek fontosságáról korábban már megemlékeztünk. A gépi tanulás részeiként említhetjük:

1.1. Felügyelt tanulás (Supervised learning) – amikor az adatok rendelkeznek azonosító címkével, így a modell tanítása után a kimenet is címkével azonosítja a felismert osztályt (osztályozás, regresszió).

1.1. Felügyelet nélküli tanulás (Unsupervised learning) – az adatok nem rendelkeznek címkével, a modell így csak az azonos kategóriába tartozó elemeket tudja összekötni (dimenzió csökkentés, csoportosítás).

A felügyelt és a felügyelet nélküli tanulás egyszerűsített ábrája.
A felügyelt és a felügyelet nélküli tanulás egyszerűsített ábrája. Forrás: Western Digital.

1.3. Megerősítő tanulás (Reinforcement learning) – a rendszer egy nulladik állapottal rendelkezik, melyet egy ügynök (esetünk egy egér) kezd el feltérképezni. A cél, hogy az ügynök megszerezze a jutalmat (sajt). Ennek érdekében, több iteráció során mozog a környezetben. A modell azokat a lépéseket értékeli pozitívnak, melynek eredményeként sikerül a jutalmat elérni.

A megerősítő tanulás bemutató ábrája.
A megerősítő tanulás bemutató ábrája. Forrás: Medium.

Nyelvfeldolgozás, beszéd

2. Nyelvfeldolgozás (Natural language processing) – a programok képessége melynek során az emberi nyelv megértése és értelmezése a cél. A nyelvfeldolgozás célja hogy olyan intelligenssé tegye a (számító)gépeket, hogy az emberekkel folyamatos kommunikációt tudjanak fenntartani.

3. Beszéd (Speech) – az eszközrendszer segítségével képesek a programok az írott anyagot beszéddé vagy a beszédet írott anyaggá alakítani (pl. Youtube hangból generált felirat funkciója).

4. Szakértői rendszerek (Expert Systems) – azon számítógépes alkalmazások melyeket egy adott területen komplex problémák megoldására találtak ki. Például mérnökök felvétele esetén szükség van a HR (emberi erőforrások) és a tapasztalt mérnökök közös véleményére, mely alapján eldöntik egy jelöltről, hogy megfelelő az adott pozícióra vagy sem.

Példa egy mesterséges intelligencia által kialakított szakértői rendszer működésére.
Példa egy mesterséges intelligencia által kialakított szakértői rendszer működésére.

5. Tervezés, ütemezés, optimalizálás (Planning, scheduling & optimization) – a gyakorlatban már sok területen alkalmazott (logisztika, raktározás, kőolajfinomítás stb.) technikák, amelyekkel beavatkozó változtatásával lehetséges a rendszer optimumának kiválasztása.

Mesterséges látás, robotika

6. Mesterséges látás (Machine vision) – napjainkban az egyik legdinamikusabban fejlődő ága a mesterséges intelligenciának. Legyen szó orvosi alkalmazásról (CT, MRI felvételek elemzése) vagy az önvezető autók témaköréről. Gyakorlatban a rendszer képes képi vagy videó anyag valós időben történő feldolgozásra, felismerésre és beavatkozásra.

Objektumok detektálása és azonosítása mesterséges látás segítségével.

7. Robotika (Robotics) – a robotok a mesterséges intelligencia egyik legfontosabb eszközei, ha arról beszélünk, hogyan lehet a programok által meghatározott intézkedéseket a valóságban végrehajtani (pl rakat mozgatás mesterséges látással történő pozícionálással és robot által történő fizikai beavatkozással). A robotok a hatékony eszközei a könnyen automatizálható vagy nagyon veszélyes tevékenységek elvégzésére, úgy hogy közben ne legyen szükség emberi beavatkozásra.

Összefoglalás

Ebből a gyors összegzésből is érezni, milyen változatos és sokrétű témák sorakoznak a nagybetűs mesterséges intelligencia fogalom mögött. Ezzel szerettem volna érzékeltetni, milyen alkalmazások és lehetőséges rejlenek még a továbbiakban, ha valaki képzéssel az MI-ben jártas személy lesz, jelenlegi foglalkozásától függetlenül.