Zum Inhalt springen

AI computer vision (Objekterkennung auf Fotos)


Empfohlene Beiträge

Hi,

mit generativer AI hat auch das sogenannte computer vision Einzug gehalten. Z.B. ist es damit möglich, Fotos beschreiben zu lassen oder auch Objekte und Text darauf zu identifizieren.

Meine Frage wäre, habt ihr Ideen zu Use Cases und könntet diese Beschreiben? Wie könnte das aussehen? Wäre eine beschreibung von Bildern im Bericht sinnvoll? Oder wäre eine Objekterkennung nur in der App nützlich (z.B. erkennen von Nummernschildern oder Schäden an Objekten?

Ich bin gespannt auf eure Ideen. Hier ein Beispiel was jeder mit GPT4 ausprobieren kann.

Eingabe:
image.png.068ba63a8e433cca7699d5f330cefad1.png

describe what food is on the image..

Zitat

The image features a well-balanced meal consisting of a seared piece of salmon, with its skin side up revealing a golden-brown crust, indicating it has been cooked to develop a crispy texture. Accompanying the salmon are whole grain penne pasta, which appears to have been either boiled or sautéed, and a serving of vegetables including sautéed sliced mushrooms and steamed broccoli with a bright green color, suggesting they have been cooked but still retain some crunch. The colors and textures suggest a health-conscious meal, with a focus on lean protein, whole grains, and vegetables.

Man beachte die Details wie die erkannte Vollkorn Paste 😄

Holger

  • Like 2
  • Haha 1
  • Zustimmung 1
Link zu diesem Kommentar
Auf anderen Seiten teilen

Fotobeschreibung finde ich aktuell noch recht aufwendig. Je detaillierter ein Bild umso wortreicher die Beschreibung.

Aber was Moritz beschrieben hat, finde ich schon eher spannend. Ein Art "Scan2Text". Man identifiziert den Text und lässt das automatisiert in die entsprechenden Bausteine einfließen. 
Das können z.B. bei uns Produktnummer auf Profilen sein, Gestellnummer, etc.. vor allem dann interessant wenn keine Barcodes vorhanden oder schlecht lesbar sind.

  • Like 1
  • Zustimmung 1
Link zu diesem Kommentar
Auf anderen Seiten teilen

Ja ich merke gerade, mein Impuls geht ein wenig in die falsche Richtung. Das ist ja eine erweiterte bzw. spezifische Object Character Recognition, also Buchstabenerkennung und keine (eher allgemeine) Object Recognition. Also bitte lasst eure Geister nicht durch mein Warrngezümmel hier einschränken... 😅

programming coding GIF

  • Haha 1
Link zu diesem Kommentar
Auf anderen Seiten teilen

Auch eine falsche Richtung ist eine Richtung... 😀

mistake-that-way.gif

 

Wir hätten durchaus Ansätze in der Fertigung, wenn Kunststoffprofile über die Maschine laufen, die jedes Profil tracken und nach Fehler analysieren.
Mit der KI-basierten Ansatz beschäftigen wir uns bereits schon. Aber an dem Punkt sehe ich keinen smap-Ansatz, da es doch hochgradig automatisiert ablaufen müsste.

Bin auf andere Ideen gespannt....

  • Like 1
  • Zustimmung 1
Link zu diesem Kommentar
Auf anderen Seiten teilen

Beide Gebiete wären mit Sicherheit spannend.

Scan2Text-Lösungen wären vielleicht interessant für Nummernschilder, Führerscheine, Kilometerstände, Stromzählerstände, Artikel- oder Auftragsnummern. 

Ich könnte mir aber auch Computer Vision vorstellen. Zum Beispiel für Berichte in den Bereichen Betriebsbegehungen/Audits, etc.

  • Like 3
  • Zustimmung 1
Link zu diesem Kommentar
Auf anderen Seiten teilen

Am 7.2.2024 um 14:21 schrieb HK alias Holger:

Hi,

mit generativer AI hat auch das sogenannte computer vision Einzug gehalten. Z.B. ist es damit möglich, Fotos beschreiben zu lassen oder auch Objekte und Text darauf zu identifizieren.

Meine Frage wäre, habt ihr Ideen zu Use Cases und könntet diese Beschreiben? Wie könnte das aussehen? Wäre eine beschreibung von Bildern im Bericht sinnvoll? Oder wäre eine Objekterkennung nur in der App nützlich (z.B. erkennen von Nummernschildern oder Schäden an Objekten?

Ich bin gespannt auf eure Ideen. Hier ein Beispiel was jeder mit GPT4 ausprobieren kann.

Eingabe:
image.png.068ba63a8e433cca7699d5f330cefad1.png

describe what food is on the image..

Man beachte die Details wie die erkannte Vollkorn Paste 😄

Holger

@Holger KreisslGesichtserkennung bei meiner Frau: In dieser Reihenfolge:  Gut gelaunt, was hast jetzt schon wieder verbrochen, bleib am besten am Schreibtisch. 

  • Haha 6
Link zu diesem Kommentar
Auf anderen Seiten teilen

Bitte melde Dich an, um einen Kommentar zu hinterlassen

Du kannst nach der Anmeldung einen Kommentar hinterlassen



Jetzt anmelden
×
×
  • Neu erstellen...