Les réseaux de neurones et l'intelligence artificielle peuvent aider à résoudre des problèmes complexes, mais jusqu'à présent, cela ne signifie pas qu'ils peuvent remplacer une personne. Voyons pourquoi ils ne sont pas capables et où ils peuvent aider, en utilisant l'exemple de plusieurs neurones.

ruDALL-E
mi-parcours
Démo de peinture
balaboba
Point E

Dans le monde de la technologie et de la robotique, on entend dire que les robots des dernières décennies effectuent des tâches qui, avant l'avènement des machines décrites, n'étaient effectuées que par une personne. En même temps, comme le montre la pratique, l'utilisation des robots et de l'intelligence artificielle ne permet pas dans tous les cas d'atteindre la qualité de performance souhaitée par rapport aux personnes. Dans un contexte de bruit informationnel autour de ChatGPT et d'autres moyens d'obtenir des informations sous forme de texte, j'ai décidé d'étudier plusieurs réseaux de neurones qui créent du contenu sous forme de texte et d'images.

ruDALL-E

DALL-E russe est un réseau neuronal qui crée des images basées sur une description textuelle. Mais en fait - un réseau de neurones capable de reconnaître des images et d'effectuer une fonction de recherche : saisissez du texte et obtenez des images. Fonctionne également avec des expressions complexes, telles que "pourquoi l'a-t-il frappé". Le réseau de neurones trouvera le mot "hit" dans le texte et l'affichera sur l'image. Fonctionne avec des images uniquement au format vectoriel (bmp, gif, jpeg, png), tandis que la taille ne dépasse pas 1 Mo. Comme première requête, j'ai utilisé le mot « vérification ». Le réseau de neurones devrait générer ce qui est écrit dans le texte. C'est du moins ce qu'il dit dans sa documentation, mais voyons comment ce sera réellement plus tard. Maintenant, je voudrais encore savoir exactement ce qui doit être saisi en tant que requête de texte. 

Et, franchement, le résultat n'était pas encourageant.

Surtout quand il y a une sorte de brume dans les images supplémentaires recommandées. En général, si vous n'êtes pas fan de tordre tout ce qui se présente sous vos yeux, alors ce réseau de neurones n'est pas pour vous. 

Cependant, en utilisant différents algorithmes, j'ai réussi à obtenir un résultat que je pouvais plus ou moins correspondre au mot "test". Je peux créer une requête qui décrira complètement l'action dans l'image. En sélectionnant diverses variantes, j'ai opté pour "Tester le réseau de neurones". 

J'ai pensé que je devais finir, mais la demande suivante "Le garçon fait ses devoirs" m'a fait réaliser que ce n'était que le début.

Eh bien, j'ai complètement glissé la requête suivante dans le processus de recherche, qui ressemble à ceci :Imprimante 3D dans l'espace ».

Nous ne parlons pas d'une photo sur la couverture d'un magazine, mais le fait que le réseau ait dessiné un croquis d'une imprimante 3D et l'ait placé dans l'espace m'a ravi à l'époque. Un bon début, pensai-je, mais mon attention a été détournée par un réseau de neurones plus puissant.

mi-parcours

En testant le réseau de neurones ruDALL-E, j'ai correspondu avec ma femme, qui m'a suggéré de tester un autre réseau de neurones appelé mi-parcours. C'était très intéressant, mais très difficile.

Comparé à ruDall-E, à première vue, Mid journey utilise d'autres algorithmes et des fonctionnalités avancées. ruDALL-E ne donne pas de résultats immédiatement, j'ai donc décidé de le tester entre les deux et de découvrir ce que Mid journey peut et peut faire.

Le processus de mise en place de l'espace de travail m'a juste épuisé. Le réseau de neurones fonctionne en entrant et en sortant des informations via Discord.

Je savais que le réseau de neurones ne fonctionnait qu'en anglais, mais le processus de saisie d'une requête n'était pas évident. Vous ne pouvez pas simplement taper du texte par analogie avec un moteur de recherche.

Et quand j'ai compris les commandes pour entrer des informations, je suis toujours tombé sur toutes sortes d'autorisations et de confirmations.

Et enfin, le processus a commencé.

Le réseau de neurones a créé le premier résultat.

Le réseau de neurones propose de choisir un des résultats obtenus afin de continuer à générer. Le résultat final est illustré dans l'image suivante.

Comparez maintenant avec le résultat qui a été obtenu dans DALL-E russe. Significativement différent, non? Pour tester ce réseau de neurones, j'ai essayé plusieurs requêtes liées à l'impression 3D. Ci-dessous, je donne des exemples proposés par le réseau de neurones pour différents appels.

En attendant l'impression 3d

Impression 3D de la ferme

Super imprimante 3D

La génération d'abstraction est certainement bonne, mais essayons une tâche plus difficile.

Essayons de créer un logo pour une entreprise qui développe des logiciels d'impression 3D. La première requête s'est avérée assez difficile pour la perception du réseau de neurones et a donné le résultat suivant.

Par conséquent, j'ai décidé de simplifier la demande afin d'obtenir quelque chose de plus intéressant et non standard. Toute demande doit être formulée de manière à être comprise. Ça ne marchera pas d'écrire quelque chose comme ça.

J'ai décidé de développer la quatrième option.

Et après plusieurs options de développement, le réseau de neurones m'a donné la version finale suivante.

Il m'est difficile d'évaluer le résultat, je laisse donc votre jugement dans les commentaires. Je peux dire avec certitude que je n'utiliserai pas ce logo pour moi-même. J'ai remarqué que là où la définition de l'impression 3D est utilisée, il existe toujours différentes variantes de crânes. Et il n'y a pas que ça. À un certain stade du développement de l'impression 3D, de nombreuses personnes ont imprimé des crânes, la photo était donc attendue. Essayons de générer un logo pour la requête "Service d'impression 3D en ligne".

Je ne me suis pas penché sur les algorithmes de génération, bien que le résultat montre qu'à partir du mot "logo", le neurone tire une idée générale du logo. Tous ces monogrammes et cette palette de couleurs nous renseignent sur la démarche générale dans la compréhension de la présentation du logo. Je n'aime pas ce style, alors j'ai essayé de combiner notre logo avec une image d'Internet sur le thème de l'impression 3D avec une couleur que j'aime.

En conséquence, nous avons obtenu un concept qui est assez intéressant à mon avis.

Et pourtant pas une solution toute faite. Juste un concept, qui, si nécessaire, devra être finalisé par le concepteur sous la forme d'une personne réelle.

À la fin, j'ai réalisé que dans les requêtes complexes sur des sujets relativement étroits, le réseau de neurones ne prend en charge que les requêtes les plus simples. Bien sûr, le nombre de ces demandes augmente et le réseau en tire des leçons, accumulant des connaissances et de l'expérience dans le contexte d'interactions avec de vraies personnes. Par exemple, il existe une telle approche de formation des réseaux de neurones, appelée "saturation", et il existe une méthode de "compression". Avec "saturation", le réseau de neurones est entraîné sur un grand nombre d'exemples d'entraînement, et avec "compression" - sur un seul. Jusqu'à présent, c'est comme communiquer avec un enfant à qui on peut enseigner le bien et le mal. Mais vous ne pourrez probablement rien apprendre de lui. D'une part, il n'est pas nécessaire d'inventer quoi que ce soit, et d'autre part, même si vous proposez quelque chose de nouveau, cela aura peut-être été inventé il y a longtemps. 

Démo de peinture

Démo de peinture est un réseau de neurones qui vous permet d'éditer des images et des photos afin de supprimer certaines choses ou objets indésirables. Une démonstration de la fonctionnalité sous la forme d'un aperçu se trouve sur la page principale du réseau de neurones.

La première étape consiste à sélectionner une image à éditer.

J'ai choisi des images de l'installation de notre objet d'art sur le mur, qui était soutenu par une main. Je me suis donné pour tâche de retirer ma main de la photo.

A fait toutes les étapes comme indiqué.

Donc ça n'a pas marché. Essayé plusieurs fois, au final le résultat souhaité n'a pas fonctionné. Pixelmator a tout de suite fait face à cette tâche.

Au final, je n'ai pas compris comment travailler avec elle. Peut-être que tu peux.

balaboba

balaboba est un réseau de neurones qui vous permet de générer une suite du texte basée sur la saisie de courts résumés et d'une brève description.

J'ai pensé, eh bien, au moins il ne devrait pas y avoir de problèmes avec le test. Maintenant, il va me proposer un tas de variations du texte, basées sur des phrases courtes et des résumés, mais ce n'était pas le cas. Très probablement, mes attentes après avoir généré des images étaient trop élevées.

En même temps, dans le cas de Balabob, j'ai réussi à écrire quelques points qui ont rempli ce texte. Lors de la rédaction de ce texte, j'ai utilisé l'aide de Balabob. Je peux identifier avec confiance le moment où c'est le réseau de neurones qui m'a aidé. Ce moment est la suggestion d'options pour continuer le texte, ce qui m'a aidé à me souvenir des moments et des aspects que j'aurais probablement oublié de décrire si je n'avais pas travaillé avec le neurone. Cependant, il manque de structure de texte, de correction d'erreurs ou d'autres fonctionnalités généralement utilisées pour l'édition. Et si j'oublie quelque chose, je peux m'en souvenir plus tard. Par conséquent, la principale aide à l'accélération. Et l'accélération du travail est aussi très bonne !

Pour ma part, j'ai identifié l'algorithme suivant pour communiquer avec Balabob. Rédiger le texte de manière brève et concise. La première étape consiste à jeter chaque phrase séquentiellement en tant que données initiales. J'ajoute immédiatement un mot ou une expression sur le sujet à la phrase. Nous attendons les résultats. Nous regardons, choisissons et ajoutons les options appropriées. Dès que le paragraphe est prêt, nous l'exécutons dans son intégralité. Nous regardons, choisissons et ajoutons les options appropriées. Dès que le texte est prêt, nous l'exécutons dans son intégralité. Structurant.

À la demande

En savoir plus sur le réseau de neurones sur le site Web studia3d.com sur mon blog.

Le réseau a émis

Sur le site, vous pouvez télécharger des modèles 3D de personnes, d'animaux, de légumes, de fruits, de voitures, etc. Vous pouvez télécharger tout cela sur votre ordinateur et l'utiliser dans votre modèle.

C'est comme ça qu'elle sait. Mais c'est vrai! En tout cas bravo =)

Comparons cela avec ma méthode habituelle d'écriture d'un article : je jette systématiquement un texte court et une thèse. Je commence à dérouler chaque phrase et chaque mot afin de décrire et de transmettre le plus possible ce que j'avais en tête. De plus, je traite tout ce qui s'est avéré structurellement. Comme vous pouvez le voir, il n'y a pratiquement aucune différence. Le réseau de neurones aide un peu à « ne rien oublier ». C'est son principal avantage.

L'expérience d'écrire un texte à l'aide d'un réseau de neurones me semblait en fait nouvelle. Bien que l'algorithme soit à peu près le même. Mais la vitesse d'écriture d'un texte avec un réseau de neurones est plus élevée et le travail était plus productif, puisque le processus de "dépliage" de la partie descriptive du texte est plus rapide. Bien que la structure du texte et le processus de transmission de l'essence de l'article doivent encore être repris, parfois même l'orthographe, car de telles fonctions qui Glavred, Balaboba ne le fait pas. Glavred, si quelqu'un ne le sait pas, aide à nettoyer le texte des déchets verbaux et vérifie la conformité avec le style informatif.

Le texte suggéré par le neurone :

Dans le monde de la technologie et de la robotique, on entend de plus en plus souvent que les robots peuvent désormais effectuer des tâches qui n'étaient auparavant possibles que pour les humains. Dans le même temps, comme le montre la pratique, l'utilisation des robots et de l'intelligence artificielle ne permet pas toujours d'atteindre une qualité de performance supérieure à celle des humains.

Glavred note 5 sur 10.

Texte corrigé par moi :

Dans le monde de la technologie et de la robotique, on entend dire que les robots des dernières décennies effectuent des tâches qui, avant l'avènement des machines décrites, n'étaient effectuées que par une personne. Dans le même temps, comme le montre la pratique, l'utilisation des robots et de l'intelligence artificielle n'atteint pas dans tous les cas la qualité de performance souhaitée par rapport aux personnes.

Glavred note 10 sur 10.

Mais en tout cas, j'ai bien aimé. C'est comme avec un enfant : vous ne pourrez probablement rien apprendre de lui. Bien qu'en général, l'enfant puisse aider avec quelque chose. Au moins pas ennuyeux. C'est formidable qu'il y ait une telle expansion de positivité.

Point E

Il est intéressant de trouver des neurones pour générer des modèles 3D. L'image est bien sûr bonne, mais l'image ne peut être imprimée que sur une imprimante ordinaire. Pour une imprimante 3D, le modèle doit être en trois dimensions, composé de polygones et non de pixels, et correspondre à les exigences.

Sur demande dans la barre de recherche, j'ai trouvé le même Point E.

Essayons comment cela fonctionne. Entrez la requête "petite imprimante 3d".

Et j'ai reçu une boîte. Intéressant. Entrons dans une requête plus simple "une imprimante 3D".

Je ne comprends pas. Je ne comprends rien. Apparemment c'est trop tôt. Et comme ce serait bien de donner à nos clients la possibilité de générer des modèles 3D simplement à partir d'une description textuelle. Apparemment c'est trop tôt.

conclusion

Cette année, les réseaux de neurones peuvent être utilisés en complément des services existants. Un bon exemple est GTranslate, un service de traduction automatique de sites Web.

GTranslate est un traducteur de site Web qui peut traduire automatiquement n'importe quel site Web dans n'importe quelle langue et le rendre accessible au monde entier !

Une caractéristique de ce service est la sélection des traductions en fonction du sujet du site.

Jusqu'à présent, les neurones existants, avec toute la beauté des cadres et des couleurs vives, ne peuvent pas remplacer les artistes, les photographes et les cadres similaires. Fonctionnalité faible, qualité plutôt faible, logique plutôt faible et un système d'interaction très complexe. Bon temps de réponse, mais on ne sait pas à quelle heure il sera quand quelque chose d'acceptable sera généré. Jusqu'à présent, cela n'est intéressant que dans le cas d'images inutiles qui ne sont nécessaires que pour remplir un espace vide avec quelque chose de coloré. Bien qu'il soit préférable d'utiliser l'abstraction pour cela.