A neurális hálózatok és a mesterséges intelligencia segíthet megoldani az összetett problémákat, de ez egyelőre nem jelenti azt, hogy helyettesíthetik az embert. Nézzük meg, miért nem képesek és hol tudnak segíteni, több idegsejt példáján.

ruDALL-E
út közepén
Befestő bemutató
balaboba
Pont

A technika és a robotika világában azt hallani, hogy a robotok az elmúlt évtizedekben olyan feladatokat látnak el, amelyeket a leírt gépek megjelenése előtt csak egy ember látott el. Ugyanakkor, ahogy a gyakorlat azt mutatja, a robotok és a mesterséges intelligencia alkalmazása nem minden esetben teszi lehetővé az emberhez képest kívánt teljesítményminőség elérését. A ChatGPT körüli információs zaj és a szöveges információszerzés egyéb módjai miatt úgy döntöttem, hogy számos neurális hálózatot tanulmányozok, amelyek szöveg és kép formájában hoznak létre tartalmat.

ruDALL-E

Az orosz DALL-E egy neurális hálózat, amely szöveges leírás alapján képeket hoz létre. De valójában - egy neurális hálózat, amely képes felismerni a képeket, valamint keresési funkciót végezni: szöveget írjon be és képeket kapjon. Komplex kifejezésekkel is működik, például „miért ütötte meg”. A neurális hálózat megtalálja a „találat” szót a szövegben, és megmutatja a képen. Csak vektoros formátumú képekkel működik (bmp, gif, jpeg, png), a méret nem haladja meg az 1 MB-ot. Első kérésként az „ellenőrzés” szót használtam. A neurális hálózatnak generálnia kell a szövegben leírtakat. Legalábbis ez áll a dokumentációjában, de lássuk, hogyan is lesz valójában később. Most még kitalálnám, hogy pontosan mit kell beírni szöveges lekérdezésként. 

És őszintén szólva az eredmény nem volt biztató.

Főleg, ha az ajánlott kiegészítő képeken valami köd van. Általánosságban elmondható, hogy ha nem rajongója annak, hogy mindent elcsavarjon, ami a szeme elé kerül, akkor ez a neurális hálózat nem neked való. 

Különböző algoritmusok segítségével azonban sikerült olyan eredményt kapnom, amelyet többé-kevésbé a „teszt” szóval tudtam párosítani. Létre tudok hozni egy lekérdezést, ami teljes mértékben leírja a képen látható műveletet. Különféle változatok kiválasztásával a „Neurális hálózat tesztelése” mellett döntöttem. 

Arra gondoltam, hogy be kéne fejeznem, de a következő kérés „A fiú házi feladatot csinál” ráébredt bennem, hogy ez még csak a kezdet.

Nos, a következő kérést teljesen belerángattam a kutatási folyamatba, ami így hangzik:3D nyomtató az űrben”.

Nem egy magazin címlapján lévő képről beszélünk, de az a tény, hogy a hálózat vázlatot rajzolt egy 3D-s nyomtatóról, és elhelyezte az űrben, annak idején örömet okozott. Jó kezdet, gondoltam, de a figyelmemet elterelte egy erősebb neurális hálózat.

út közepén

A ruDALL-E neurális hálózat tesztelése közben leveleztem a feleségemmel, aki azt javasolta, hogy teszteljek egy másik neurális hálózatot, az ún. út közepén. Nagyon érdekes volt, de nagyon nehéz.

A ruDall-E-hez képest első pillantásra a Mid travel más algoritmusokat és fejlett funkciókat használ. A ruDALL-E nem ad azonnali eredményt, ezért úgy döntöttem, hogy közben kipróbálom, és megtudom, mire képes és mire képes a Mid travel.

A munkaterület kialakításának folyamata egyszerűen kimerített. A neurális hálózat úgy működik, hogy információkat ad be és ad ki a Discordon keresztül.

Tudtam, hogy a neurális hálózat csak angolul működik, de a kérés bevitelének folyamata nem volt nyilvánvaló. Nem lehet csak szöveget beírni a keresőmotorhoz hasonló módon.

És amikor kitaláltam az információbeviteli parancsokat, még mindig belebotlottam mindenféle engedélybe és megerősítésbe.

És végül elkezdődött a folyamat.

A neurális hálózat hozta létre az első eredményt.

A neurális hálózat felajánlja, hogy a kapott eredmények közül válasszon egyet a generálás folytatásához. A végeredmény a következő képen látható.

Most hasonlítsa össze a kapott eredménnyel Orosz DALL-E. Lényegesen más, igaz? Ennek a neurális hálózatnak a teszteléséhez több olyan lekérdezést is kipróbáltam, amelyek a 3D nyomtatáshoz kapcsolódnak. Az alábbiakban példákat adok a neurális hálózat által javasolt különböző hívásokhoz.

Várom a 3D nyomtatást

Farm 3D nyomtatás

Szuper 3D nyomtató

Az absztrakciógenerálás természetesen jó, de próbáljunk meg egy nehezebb feladatot.

Próbáljunk meg logót készíteni egy 3D nyomtatáshoz szoftvert fejlesztő cégnek. Az első kérés meglehetősen nehéznek bizonyult a neurális hálózat észlelése szempontjából, és a következő eredményt adta.

Ezért úgy döntöttem, hogy leegyszerűsítem a kérést, hogy valami érdekesebbet és nem szabványosabbat kapjak. Minden kérést úgy kell megfogalmazni, hogy az érthető legyen. Egyszerűen nem megy ilyesmit írni.

A negyedik lehetőség kidolgozása mellett döntöttem.

És több fejlesztési lehetőség után a neurális hálózat a következő végleges verziót adta nekem.

Nehezen tudom értékelni az eredményt, ezért a megjegyzésekben az Ön megítélésére bízom. Biztosan állíthatom, hogy ezt a logót nem fogom használni magamnak. Észrevettem, hogy ahol a 3D nyomtatás definícióját használják, ott mindig vannak különböző koponyaváltozatok. És nem csak erről van szó. A 3D nyomtatás fejlődésének egy bizonyos pontján sokan koponyát nyomtattak, így várható volt a fotó. Próbáljunk meg logót generálni az "Online 3D nyomtatási szolgáltatás" lekérdezéshez.

Nem mélyedtem el a generálási algoritmusokba, bár az eredmény azt mutatja, hogy a „logó” szóból az idegsejt valamilyen általános elképzelést húz a logóról. Mindezek a monogramok és színpaletták a logó megjelenítésének általános megközelítéséről árulkodnak. Nem szeretem ezt a stílust, ezért megpróbáltam a logónkat egy internetről származó képpel kombinálni 3D nyomtatás témájában olyan színnel, ami nekem tetszik.

Ennek eredményeként egy olyan koncepciót kaptunk, amely szerintem elég érdekes.

És mégsem kész megoldás. Csak egy koncepció, amit szükség esetén a tervezőnek kell véglegesítenie valós személy formájában.

A végén rájöttem, hogy a viszonylag szűk témakörű összetett lekérdezéseknél a neurális hálózat csak a legegyszerűbb lekérdezéseket támogatja. Természetesen ezeknek a kéréseknek a száma növekszik, és a hálózat tanul belőlük, tudást és tapasztalatot gyűjt a valós emberekkel való interakció hátterében. Például van egy ilyen megközelítés a neurális hálózatok képzésére, amelyet "telítettségnek" neveznek, és van egy "tömörítési" módszer. A "telítettséggel" a neurális hálózat képzési példák nagy halmaza alapján történik, a "tömörítéssel" pedig csak egy. Eddig ez olyan, mintha egy gyerekkel kommunikálnánk, akit jóra és rosszra is lehet tanítani. De valószínűleg nem fogsz tudni semmit tanulni tőle. Egyrészt nem kell kitalálni semmit, másrészt ha kitalál is valami újat, akkor ezt talán már régen kitalálták. 

Befestő bemutató

Befestő bemutató egy neurális hálózat, amely lehetővé teszi a képek és fényképek szerkesztését a nem kívánt dolgok vagy tárgyak eltávolítása érdekében. A funkcionalitás bemutatója előnézet formájában a neurális hálózat főoldalán található.

Az első lépés a szerkeszteni kívánt kép kiválasztása.

A képeket a műtárgyunk falra illesztéséből választottam, amelyet kézzel támasztottam alá. Azt a feladatot tűztem ki magam elé, hogy eltávolítsam a kezemet a fényképről.

Minden lépést megtett az utasításoknak megfelelően.

Szóval nem sikerült. Többször próbálkozott, végül nem jött be a kívánt eredmény. A Pixelmator azonnal megbirkózott ezzel a feladattal.

Végül nem értettem, hogyan kell vele dolgozni. Talàn képes vagy.

balaboba

balaboba egy neurális hálózat, amely lehetővé teszi a szöveg folytatásának létrehozását rövid absztraktok és rövid leírás alapján.

Arra gondoltam, legalább nem lehet probléma a teszttel. Most egy csomó variációt fog felajánlani nekem a szövegből, rövid mondatok és absztraktok alapján, de ez nem így volt. Valószínűleg túl magasak voltak az elvárásaim a képek létrehozása után.

Ugyanakkor Balabob esetében sikerült néhány pontot leírnom, amelyek kitöltötték ezt a szöveget. A szöveg írásakor Balabob segítségét vettem igénybe. Magabiztosan be tudom azonosítani azt a pillanatot, amikor a neurális hálózat segített. Ez a pillanat a szöveg folytatásának lehetőségeinek javaslata, amely segített emlékeznem azokra a pillanatokra és szempontokra, amelyeket valószínűleg elfelejtettem volna leírni, ha nem dolgoztam volna a neuronnal. Mindazonáltal hiányzik belőle a szövegstruktúra, a hibajavítás vagy a szerkesztéshez általában használt egyéb funkciók. És ha elfelejtek valamit, később emlékezni fogok rá. Ezért a fő segítség a gyorsulásban. És a munka gyorsulása is nagyon jó!

Saját magam számára a következő algoritmust azonosítottam a Balabobbal való kommunikációhoz. A szöveget röviden és tömören írta le. Az első lépés az, hogy minden mondatot egymás után kiindulási adatként kell bedobni. Azonnal hozzáadok a mondathoz egy szót vagy kifejezést a témában. Várjuk az eredményeket. Megnézzük, kiválasztjuk és hozzáadjuk a megfelelő opciókat. Amint elkészül a bekezdés, teljes egészében futtatjuk. Megnézzük, kiválasztjuk és hozzáadjuk a megfelelő opciókat. Amint elkészült a szöveg, teljes egészében futtatjuk. Strukturálás.

Kérésre

A neurális hálózatról bővebben a weboldalon olvashat studia3d.com a blogomon.

A hálózat kiadta

Az oldalról 3D modelleket tölthet le emberekről, állatokról, zöldségekről, gyümölcsökről, autókról stb. Mindezt letöltheti számítógépére, és felhasználhatja a modelljében.

Ő így tudja. De igaz! Mindenesetre jól sikerült =)

Hasonlítsuk össze ezt a szokásos cikkírási módszeremmel: következetesen bedobok egy rövid szöveget és szakdolgozatot. Elkezdek minden mondatot és szót kibontakozni, hogy minél jobban leírjam és átadjam, amit gondoltam. Továbbá mindent feldolgozok, ami szerkezetileg kiderült. Mint látható, gyakorlatilag nincs különbség. A neurális hálózat egy kicsit segít, hogy „ne felejtsünk el semmit”. Ez a fő előnye.

A neurális hálózat segítségével történő szövegírás tapasztalata valójában újszerűnek tűnt számomra. Bár az algoritmus megközelítőleg ugyanaz. Ám a neurális hálóval gyorsabban írunk szöveget, és eredményesebb a munka, hiszen gyorsabb a leíró szövegrész „kibontásának” folyamata. Bár a szöveg szerkezetét és a cikk lényegének átadásának folyamatát még át kell venni, olykor a helyesírást is, mert olyan funkciókat, Glavred, Balaboba nem. A Glavred, ha valaki nem ismerné, segít a verbális szeméttől eltávolítani a szöveget, és ellenőrzi az információs stílus betartását.

A neuron által javasolt szöveg:

A technológia és a robotika világában egyre gyakrabban lehet hallani arról, hogy a robotok ma már olyan feladatokat is képesek ellátni, amelyekre korábban csak az ember tehetett. Ugyanakkor, amint azt a gyakorlat mutatja, a robotok és a mesterséges intelligencia használata nem mindig teszi lehetővé az embereknél magasabb teljesítmény elérését.

Glavred értékelés 5/10.

Az általam javított szöveg:

A technika és a robotika világában azt hallani, hogy a robotok az elmúlt évtizedekben olyan feladatokat hajtanak végre, amelyeket a leírt gépek megjelenése előtt csak egy ember látott el. Ugyanakkor, ahogy a gyakorlat azt mutatja, a robotok és a mesterséges intelligencia használata nem minden esetben éri el a kívánt teljesítményminőséget az emberekhez képest.

Glavred értékelés 10/10.

De egyébként tetszett. Ez olyan, mint egy gyereknél: valószínűleg nem fogsz tudni tőle valamit tanulni. Bár általában a gyerek tud segíteni valamiben. Legalább nem unalmas. Nagyon jó, hogy ilyen mértékben bővül a pozitivitás.

Pont

Érdekes neuronokat találni 3D modellek generálásához. A kép természetesen jó, de a kép csak normál nyomtatón nyomtatható. 3D nyomtató esetén a modellnek háromdimenziósnak kell lennie, sokszögekből kell állnia, nem pixelekből, és meg kell felelnie a követelményeknek.

Kérésre a keresősávban ugyanezt találtam Pont.

Próbáljuk ki, hogyan működik. Írja be a "kis 3D nyomtató" lekérdezést.

És kapott egy dobozt. Érdekes. Adjunk meg egy egyszerűbb "3D nyomtató" lekérdezést.

nem értem. nem értek semmit. Úgy tűnik, túl korai. És milyen jó lenne lehetőséget adni ügyfeleinknek arra, hogy egyszerűen szöveges leírásból 3D modelleket generáljanak. Úgy tűnik, túl korai.

Teljesítmény

Idén a neurális hálózatok a meglévő szolgáltatások kiegészítéseként használhatók. Jó példa erre a GTranslate, egy webhely gépi fordító szolgáltatása.

GTranslate egy webhely fordító, amely bármely webhelyet automatikusan lefordít bármilyen nyelvre, és elérhetővé teszi az egész világ számára!

A szolgáltatás egyik jellemzője a fordítások kiválasztása az oldal tárgyának megfelelően.

Eddig a meglévő neuronok a keretek minden szépségével és élénk színeivel nem helyettesíthetik a művészeket, fotósokat és hasonló kereteket. Gyenge funkcionalitás, meglehetősen gyenge minőség, meglehetősen gyenge logika és nagyon összetett interakciós rendszer. Jó válaszidő, de nem világos, hogy mikor lesz valami elfogadható. Egyelőre ez csak a haszontalan képek esetében érdekes, amik csak azért kellenek, hogy valami üres helyet megtöltsünk valami színessel. Bár jobb ehhez az absztrakciót használni.